Lmst

BREAKING | #Budget2026
Trading costs rise sharply as STT on derivatives is increased.
Revised STT rates:
F&O Futures: 0.5% (earlier 0.02%)
Options (on premium): 0.15% (earlier 0.10%)
The hike significantly increases costs for active traders, particularly high-frequency traders and scalpers.
#STT #Markets #FNO

Tôi vừa xây dựng bàn phím iOS Whispr chạy STT trực tiếp trên NPU, không cần đám mây, đăng nhập, chỉ cần nhập nhanh và quản lý clipboard thông minh #STT #NPU #iOS #BànPhím #ỨngDụng #QuyềnRiêngTư #TruyềnGiọngNói #Clipboard #iOSKeyboard #SpeechToText #PrivacyFirst

https://www.reddit.com/r/SideProject/comments/1qs4q2m/i_built_an_ios_keyboard_that_runs_stt_locally_on/

AI Speech Technologies

This page is a collection of notes and links related to AI speech technologies, including Text-to-Speech (TTS), Speech-to-Text (STT), voice synthesis, voice cloning, and other rela(...)

#ai #cloning #speech #stt #synthesis #tts #voice #whisper

https://taoofmac.com/space/ai/speech?utm_content=atom&utm_source=mastodon&utm_medium=social

I wrote an article on how to auto-dub a video to replace your voice with an AI voice using OBS Studio, SpeechNote and FFmpeg

Quite easy to achieve this with OSS software (and offline models).

https://www.kentoseth.com/posts/2026/jan/30/how-to-auto-dub-a-video-to-replace-your-voice-with-an-ai-voice-using-obs-studio-speechnote-and-ffmpeg/

#AI #OBS #speechnote #STT #TTS #FFmpeg

STT:n päätoimittaja: uutinen Tuppuraisesta perustui laajaan lähdepohjaan – oikaisupyyntöjä ei ole saatu

Tytti Tuppurainen kiisti STT:n jutussa esitetyt väitteet hänen käytöksestään. STT:n päätoimittaja sanoo, ettei ole saanut oikaisupyyntöjä jutusta.

https://yle.fi/a/74-20207271

#Media #Tyttituppurainen #Minnaholopainen #Journalismi #Stt #Politiikka

STT:n päätoimittaja Tytti Tuppuraista koskevasta jutusta: Aivan ehdottomasti seison päätoimittajana jutun takana

STT:n päätoimittaja Minna Holopainen kommentoi asiaa Ylelle puhelimitse.

https://yle.fi/a/74-20207061

#Politiikka #Stt #Kotimaa

La projekto Common Voice de Mozilla celas instui al maŝinoj kiel homoj parolas. Ĝi nun havas novan sekcion "Respondi Demandojn" kie oni libere respondas al demandojn anstataŭ nur laŭtlegi frazojn. Donacu vian voĉon nun por pligrandigi la esperantan datumaron!

https://commonvoice.mozilla.org/eo

#Esperanto #CommonVoice #Mozilla #STT

Should STT in the cash market be cut? Ahead of Budget 2026, Jio BlackRock says rationalising the tax could deepen the cash market, attract foreign inflows and benefit domestic investors. https://english.mathrubhumi.com/multimedia/videos/union-budget-2026-jio-blackrock-bats-stt-oh7neuep?utm_source=dlvr.it&utm_medium=mastodon #UnionBudget2026 #JioBlackRock #StockMarket #STT #MutualFunds

🚀 Tìm mô hình STT nhanh cho RTX 570 8GB, hỗ trợ tiếng Ả Rập & Persian, chạy offline hoàn toàn. Hiện Whisper‑large‑turbo chậm, Parakeet không hỗ trợ, SeamlessM4T quá nặng. Muốn gợi ý model nhẹ, framework VAD‑>STT‑>T2T‑>TTS hiệu quả cho môi trường NGO, bảo mật dữ liệu. #AI #STT #Chatbot #Offline #Privacy #NGO #DịchThuật #CôngNghệ #OpenSource #BảoMật #Translation #VoiceToText #AIVietnam 🌍✨

https://www.reddit.com/r/LocalLLaMA/comments/1qk2kz1/seeking_local_translation_stack_recommendations/

I'm convinced #speechtotext #STT existed more than 5 years ago but blowed if I can find anything to do the job which isn't an " #AI agent"
Is that because the old tools went away, search engines stopped showing them, or I'm terrible at searching? Unsure, but hopefully I stumble through this fog soon.

Голос и микроконтроллер ESP32

Картинка: freepik.com - vecstock При построении разнообразных автоматизированных систем часто возникает потребность, чтобы эта система предоставляла какую-то обратную связь. В этой связи большинство идут самым простым путём: мигающие лампочки, светодиоды, мониторы разных мастей с выведением на них текстовой/графической информации… Однако есть одна очень интересная тема, которую почему-то незаслуженно самодельщики обходят стороной — речь о микроконтроллерах! Потому что, согласитесь, «мигание лампочек» — это, конечно, прекрасно и даже в некотором роде волшебно (особенно когда это происходит в первый раз в жизни и твоя программа наконец начинает работать :-) ). Но куда веселее, когда машина отвечает тебе голосом! :-) Поэтому посмотрим, какие здесь возможности имеются...

https://habr.com/ru/companies/ruvds/articles/980276/?utm_source=habrahabr&utm_medium=rss&utm_campaign=980276

#tts #stt #распознавание_речи #генерация_речи #ruvds_статьи

Голос и микроконтроллер ESP32

Картинка: freepik.com - vecstock При построении разнообразных автоматизированных систем часто возникает потребность, чтобы эта система предоставляла какую-то обратную связь. В этой связи большинство идут самым простым путём: мигающие лампочки, светодиоды, мониторы разных мастей с выведением на них текстовой/графической информации… Однако есть одна очень интересная тема, которую почему-то незаслуженно самодельщики обходят стороной — речь о микроконтроллерах! Потому что, согласитесь, «мигание лампочек» — это, конечно, прекрасно и даже в некотором роде волшебно (особенно когда это происходит в первый раз в жизни и твоя программа наконец начинает работать :-) ). Но куда веселее, когда машина отвечает тебе голосом! :-) Поэтому посмотрим, какие здесь возможности имеются...

https://habr.com/ru/companies/ruvds/articles/980276/

#tts #stt #распознавание_речи #генерация_речи #ruvds_статьи

So sánh 26 mô hình Chuyển giọng nói thành văn bản (STT) trên dữ liệu hội thoại y tế dài, đánh giá bởi WER (tỷ lệ lỗi từ). Dẫn đầu là Google Gemini 2.5 Pro (10.79% WER), tiếp theo là mô hình địa phương Parakeet TDT 0.6B v3 với tốc độ 6.3s/file và WER 11.9%. GPT-4o Mini cải thiện mạnh (12.82% WER). Google MedASR thất bại nặng (64.9% WER). Mã nguồn và bảng xếp hạng đầy đủ đã được công khai. #SpeechToText #STT #AI #HealthcareAI #Gemini #GPT4o #Parakeet #Whisper #Benchmarks #MôHìnhAI #ChuyểnGiọngNói

Top STT mô hình xử lý hội thoại y tế: Google Gemini 2.5 Pro dẫn đầu (10.79% WER), tiếp theo là Parakeet TDT 0.6B v3 (11.90% WER) – mô hình địa phương nhanh nhất (~6s/file trên M4). GPT-4o Mini cải thiện đáng kể (12.82% WER). Google MedASR thất bại dù chuyên biệt cho y tế (64.9% WER). Code đánh giá và bảng xếp hạng đầy đủ cho 26 mô hình đã công khai. #STT #SpeechToText #AIytes #Parakeet #Gemini #GPT4o #LocalAI #Benchmarks #NhậnDiễnGiọngNói #TríTuệNhânTạo #YtếSố #AIcụcbộ

https://www.reddit.com/r/

Meeting-LLM: Транскрипция + ИИ-анализ совещаний в одном окне своими руками (T-One + GPT-OSS-20B)

В интернете огромное количество гайдов на тему транскрибации аудио и анализа совещаний через ИИ. Но все они описывают разрозненные решения: отдельно транскрибируй аудио, затем отправь в ChatGPT, и так далее. Я решил комплексно подойти к этому вопросу и навайбкодить веб-приложение, где все задачи решаются в одном окне, а именно: - Хранение транскрипций -Чат с ИИ по содержимому встречи -Структурированные протоколы (задачи, решения, события) -Рекомендации ИИ на базе текущей и предыдущих встреч -Интеграция с CRM в один клик (beta)

https://habr.com/ru/articles/981370/

#Сезон_ИИ_в_разработке #GPTOSS20B #транскрипция #STT #TOne #vLLM #LLM #совещания #протоколы #Docker

Cộng đồng AI đang thảo luận về các công cụ chuyển giọng nói thành văn bản (STT) và văn bản thành giọng nói (TTS) tương thích OpenAI API cho OpenWebUI. Một người dùng tìm kiếm lời khuyên về Speaches AI, LocalAI, AllTalkTTS và các mô hình như WhisperSTT, PiperTTS, CoquiTTS để có giọng nói tự nhiên hơn. Bạn dùng công cụ nào?

#AI #STT #TTS #OpenWebUI #LocalAI #SpeachesAI #AllTalkTTS

https://www.reddit.com/r/LocalLLaMA/comments/1pvab1g/open_ai_api_compatible_server_for_stttts_to/

Whisper V2 và V3/V3 Turbo có sự khác biệt hiệu suất lớn không? Kết quả thử nghiệm với RealtimeSTT cho thấy cả hai mô hình đều sai trọng phát âm "Brieva" (14.1%) và "Nematron" (12.9%). Mức độ chính xác thấp dường như không cải thiện đáng kể giữa các phiên bản. #Whisper #AI #DeepLearning #KhoaHocMayTinh #STT #NghiencuuAI

https://www.reddit.com/r/LocalLLaMA/comments/1pqy3d8/is_there_a_huge_performance_difference_between/

Умеет ли Gemini в TTS и транскрибацию?

Немного о работе с моделями гемини, небольшой анализ других LLM и собственный инструмент Привет, Хабр! В предыдущих статьях я делился опытом создания инструментов для работы со структурированными данными на базе Gemini. Этот проект, начатый из практической необходимости, перерос в нечто большее — в исследовательский интерес к возможностям современных ИИ-моделей. Если работа с текстами и таблицами стала понятной, то огромный пласт неструктурированных данных — аудиозаписи совещаний, вебинары, обучающие видео — оставался для моих инструментов «слепой зоной». Моей новой целью стало освоение мультимодальных возможностей Gemini. Частично это был чистый интерес — желание научиться работать с моделями, способными обрабатывать звук и видео. Частично — решение прикладных задач. Я сформулировал для себя три ключевые задачи, которые должен был решить мой обновленный инструмент:

https://habr.com/ru/articles/975954/

#сезон_ии_в_разработке #ии #искусственный_интеллект #tts #stt #транскрибация

AI Runner v5.1.0 ra mắt! 🚀 Hỗ trợ tạo ảnh, chuyển văn bản thành giọng nói (TTS) và giọng nói thành văn bản (STT) ở chế độ headless server. Ứng dụng này có thể thay thế Ollama để thử nghiệm, học tập và phát triển chatbot. Có cả giao diện GUI! #AI #MachineLearning #TTS #STT #AIRunner #TríTuệNhânTạo #HọcMáy #CôngNghệ

https://www.reddit.com/r/ollama/comments/1pe38x8/ai_runner_release_v510_support_for_art/

Giải pháp mã nguồn mở thay thế API real-time của OpenAI:
- STT: Whisper V3
- LLM: Gemma 3 1B
- TTS: Kokoro
- Hạ tầng: Simplismart.ai
- Framework: Pipecat
Độ trễ dưới 400ms. Dễ dàng thay đổi model theo yêu cầu.
#opensource #AI #LLM #TTS #STT #trituenhantao #maguonmo

https://www.reddit.com/r/LocalLLaMA/comments/1pc1w58/openai_realtime_api_opensource_alternative/

#STT

Client Info