#STT

efiletaxefiletax
2026-02-01

BREAKING |
Trading costs rise sharply as STT on derivatives is increased.
Revised STT rates:
F&O Futures: 0.5% (earlier 0.02%)
Options (on premium): 0.15% (earlier 0.10%)
The hike significantly increases costs for active traders, particularly high-frequency traders and scalpers.

2026-01-31

Tôi vừa xây dựng bàn phím iOS Whispr chạy STT trực tiếp trên NPU, không cần đám mây, đăng nhập, chỉ cần nhập nhanh và quản lý clipboard thông minh #STT #NPU #iOS #BànPhím #ỨngDụng #QuyềnRiêngTư #TruyềnGiọngNói #Clipboard #iOSKeyboard #SpeechToText #PrivacyFirst

reddit.com/r/SideProject/comme

Tao of Mactaoofmac
2026-01-31

AI Speech Technologies

This page is a collection of notes and links related to AI speech technologies, including Text-to-Speech (TTS), Speech-to-Text (STT), voice synthesis, voice cloning, and other rela(...)

taoofmac.com/space/ai/speech?u

AI Speech Technologies
2026-01-30

I wrote an article on how to auto-dub a video to replace your voice with an AI voice using OBS Studio, SpeechNote and FFmpeg

Quite easy to achieve this with OSS software (and offline models).

kentoseth.com/posts/2026/jan/3

#AI #OBS #speechnote #STT #TTS #FFmpeg

2026-01-29

STT:n päätoimittaja: uutinen Tuppuraisesta perustui laajaan lähdepohjaan – oikaisupyyntöjä ei ole saatu

Tytti Tuppurainen kiisti STT:n jutussa esitetyt väitteet hänen käytöksestään. STT:n päätoimittaja sanoo, ettei ole saanut oikaisupyyntöjä jutusta.

yle.fi/a/74-20207271

#Media #Tyttituppurainen #Minnaholopainen #Journalismi #Stt #Politiikka

2026-01-28

STT:n päätoimittaja Tytti Tuppuraista koskevasta jutusta: Aivan ehdottomasti seison päätoimittajana jutun takana

STT:n päätoimittaja Minna Holopainen kommentoi asiaa Ylelle puhelimitse.

yle.fi/a/74-20207061

#Politiikka #Stt #Kotimaa

2026-01-25

La projekto Common Voice de Mozilla celas instui al maŝinoj kiel homoj parolas. Ĝi nun havas novan sekcion "Respondi Demandojn" kie oni libere respondas al demandojn anstataŭ nur laŭtlegi frazojn. Donacu vian voĉon nun por pligrandigi la esperantan datumaron!

commonvoice.mozilla.org/eo

#Esperanto #CommonVoice #Mozilla #STT

Mathrubhumi EnglishMathrubhumi_English
2026-01-24

Should STT in the cash market be cut? Ahead of Budget 2026, Jio BlackRock says rationalising the tax could deepen the cash market, attract foreign inflows and benefit domestic investors. english.mathrubhumi.com/multim

2026-01-22

🚀 Tìm mô hình STT nhanh cho RTX 570 8GB, hỗ trợ tiếng Ả Rập & Persian, chạy offline hoàn toàn. Hiện Whisper‑large‑turbo chậm, Parakeet không hỗ trợ, SeamlessM4T quá nặng. Muốn gợi ý model nhẹ, framework VAD‑>STT‑>T2T‑>TTS hiệu quả cho môi trường NGO, bảo mật dữ liệu. #AI #STT #Chatbot #Offline #Privacy #NGO #DịchThuật #CôngNghệ #OpenSource #BảoMật #Translation #VoiceToText #AIVietnam 🌍✨

reddit.com/r/LocalLLaMA/commen

2026-01-09

I'm convinced #speechtotext #STT existed more than 5 years ago but blowed if I can find anything to do the job which isn't an " #AI agent"
Is that because the old tools went away, search engines stopped showing them, or I'm terrible at searching? Unsure, but hopefully I stumble through this fog soon.

2026-01-02

Голос и микроконтроллер ESP32

Картинка: freepik.com - vecstock При построении разнообразных автоматизированных систем часто возникает потребность, чтобы эта система предоставляла какую-то обратную связь. В этой связи большинство идут самым простым путём: мигающие лампочки, светодиоды, мониторы разных мастей с выведением на них текстовой/графической информации… Однако есть одна очень интересная тема, которую почему-то незаслуженно самодельщики обходят стороной — речь о микроконтроллерах! Потому что, согласитесь, «мигание лампочек» — это, конечно, прекрасно и даже в некотором роде волшебно (особенно когда это происходит в первый раз в жизни и твоя программа наконец начинает работать :-) ). Но куда веселее, когда машина отвечает тебе голосом! :-) Поэтому посмотрим, какие здесь возможности имеются...

habr.com/ru/companies/ruvds/ar

#tts #stt #распознавание_речи #генерация_речи #ruvds_статьи

2026-01-01

Голос и микроконтроллер ESP32

Картинка: freepik.com - vecstock При построении разнообразных автоматизированных систем часто возникает потребность, чтобы эта система предоставляла какую-то обратную связь. В этой связи большинство идут самым простым путём: мигающие лампочки, светодиоды, мониторы разных мастей с выведением на них текстовой/графической информации… Однако есть одна очень интересная тема, которую почему-то незаслуженно самодельщики обходят стороной — речь о микроконтроллерах! Потому что, согласитесь, «мигание лампочек» — это, конечно, прекрасно и даже в некотором роде волшебно (особенно когда это происходит в первый раз в жизни и твоя программа наконец начинает работать :-) ). Но куда веселее, когда машина отвечает тебе голосом! :-) Поэтому посмотрим, какие здесь возможности имеются...

habr.com/ru/companies/ruvds/ar

#tts #stt #распознавание_речи #генерация_речи #ruvds_статьи

2025-12-30

So sánh 26 mô hình Chuyển giọng nói thành văn bản (STT) trên dữ liệu hội thoại y tế dài, đánh giá bởi WER (tỷ lệ lỗi từ). Dẫn đầu là Google Gemini 2.5 Pro (10.79% WER), tiếp theo là mô hình địa phương Parakeet TDT 0.6B v3 với tốc độ 6.3s/file và WER 11.9%. GPT-4o Mini cải thiện mạnh (12.82% WER). Google MedASR thất bại nặng (64.9% WER). Mã nguồn và bảng xếp hạng đầy đủ đã được công khai. #SpeechToText #STT #AI #HealthcareAI #Gemini #GPT4o #Parakeet #Whisper #Benchmarks #MôHìnhAI #ChuyểnGiọngNói

2025-12-30

Top STT mô hình xử lý hội thoại y tế: Google Gemini 2.5 Pro dẫn đầu (10.79% WER), tiếp theo là Parakeet TDT 0.6B v3 (11.90% WER) – mô hình địa phương nhanh nhất (~6s/file trên M4). GPT-4o Mini cải thiện đáng kể (12.82% WER). Google MedASR thất bại dù chuyên biệt cho y tế (64.9% WER). Code đánh giá và bảng xếp hạng đầy đủ cho 26 mô hình đã công khai. #STT #SpeechToText #AIytes #Parakeet #Gemini #GPT4o #LocalAI #Benchmarks #NhậnDiễnGiọngNói #TríTuệNhânTạo #YtếSố #AIcụcbộ

reddit.com/r/

2025-12-29

Meeting-LLM: Транскрипция + ИИ-анализ совещаний в одном окне своими руками (T-One + GPT-OSS-20B)

В интернете огромное количество гайдов на тему транскрибации аудио и анализа совещаний через ИИ. Но все они описывают разрозненные решения: отдельно транскрибируй аудио, затем отправь в ChatGPT, и так далее. Я решил комплексно подойти к этому вопросу и навайбкодить веб-приложение, где все задачи решаются в одном окне, а именно: - Хранение транскрипций -Чат с ИИ по содержимому встречи -Структурированные протоколы (задачи, решения, события) -Рекомендации ИИ на базе текущей и предыдущих встреч -Интеграция с CRM в один клик (beta)

habr.com/ru/articles/981370/

#Сезон_ИИ_в_разработке #GPTOSS20B #транскрипция #STT #TOne #vLLM #LLM #совещания #протоколы #Docker

2025-12-25

Cộng đồng AI đang thảo luận về các công cụ chuyển giọng nói thành văn bản (STT) và văn bản thành giọng nói (TTS) tương thích OpenAI API cho OpenWebUI. Một người dùng tìm kiếm lời khuyên về Speaches AI, LocalAI, AllTalkTTS và các mô hình như WhisperSTT, PiperTTS, CoquiTTS để có giọng nói tự nhiên hơn. Bạn dùng công cụ nào?

#AI #STT #TTS #OpenWebUI #LocalAI #SpeachesAI #AllTalkTTS

reddit.com/r/LocalLLaMA/commen

2025-12-19

Whisper V2 và V3/V3 Turbo có sự khác biệt hiệu suất lớn không? Kết quả thử nghiệm với RealtimeSTT cho thấy cả hai mô hình đều sai trọng phát âm "Brieva" (14.1%) và "Nematron" (12.9%). Mức độ chính xác thấp dường như không cải thiện đáng kể giữa các phiên bản. #Whisper #AI #DeepLearning #KhoaHocMayTinh #STT #NghiencuuAI

reddit.com/r/LocalLLaMA/commen

2025-12-12

Умеет ли Gemini в TTS и транскрибацию?

Немного о работе с моделями гемини, небольшой анализ других LLM и собственный инструмент Привет, Хабр! В предыдущих статьях я делился опытом создания инструментов для работы со структурированными данными на базе Gemini. Этот проект, начатый из практической необходимости, перерос в нечто большее — в исследовательский интерес к возможностям современных ИИ-моделей. Если работа с текстами и таблицами стала понятной, то огромный пласт неструктурированных данных — аудиозаписи совещаний, вебинары, обучающие видео — оставался для моих инструментов «слепой зоной». Моей новой целью стало освоение мультимодальных возможностей Gemini. Частично это был чистый интерес — желание научиться работать с моделями, способными обрабатывать звук и видео. Частично — решение прикладных задач. Я сформулировал для себя три ключевые задачи, которые должен был решить мой обновленный инструмент:

habr.com/ru/articles/975954/

#сезон_ии_в_разработке #ии #искусственный_интеллект #tts #stt #транскрибация

2025-12-04

AI Runner v5.1.0 ra mắt! 🚀 Hỗ trợ tạo ảnh, chuyển văn bản thành giọng nói (TTS) và giọng nói thành văn bản (STT) ở chế độ headless server. Ứng dụng này có thể thay thế Ollama để thử nghiệm, học tập và phát triển chatbot. Có cả giao diện GUI! #AI #MachineLearning #TTS #STT #AIRunner #TríTuệNhânTạo #HọcMáy #CôngNghệ

reddit.com/r/ollama/comments/1

2025-12-02

Giải pháp mã nguồn mở thay thế API real-time của OpenAI:
- STT: Whisper V3
- LLM: Gemma 3 1B
- TTS: Kokoro
- Hạ tầng: Simplismart.ai
- Framework: Pipecat
Độ trễ dưới 400ms. Dễ dàng thay đổi model theo yêu cầu.
#opensource #AI #LLM #TTS #STT #trituenhantao #maguonmo

reddit.com/r/LocalLLaMA/commen

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst