#TextToSpeech

2026-01-30

VoxTube: Công cụ chuyển đổi YouTube sang audio với text-to-speech cục bộ. Tự lưu trữ, không phụ thuộc vào cloud, không giới hạn sử dụng. #VoxTube #YouTube #TextToSpeech #TựLưuTrữ #CôngCụ #SelfHosted #AudioConverter #LocalTTS

reddit.com/r/selfhosted/commen

2026-01-30

Công cụ Web UI mới cho Qwen3-TTS vừa được ra mắt, hỗ trợ cloning giọng nói (voice cloning) mạnh mẽ. Dự án sử dụng Nix và UV để quản lý môi trường, đặc biệt tích hợp khả năng lấy mẫu âm thanh trực tiếp từ YouTube. Hiện tại công cụ đã có sẵn API và giao diện web thân thiện, tối ưu cho người dùng muốn trải nghiệm AI tạo giọng nói tại địa phương.

#AI #Qwen3 #VoiceCloning #TextToSpeech #OpenSource #NixOS #CongNghe #TriTueNhânTao #AIHocMay

reddit.com/r/LocalLLaMA/commen

2026-01-29

Новые LLM из Китая, бесплатный аналог Suno, ИИ-собеседник от Nvidia и признание Альтмана о текстах в GPT

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя выдалась насыщенной: куча мощнейших релизов из Китая, которые наступают на пятки GPT-5.2 и Gemini 3. Реалтайм инструменты от Krea и NVIDIA, генеративные модели от Qwen и Hunyuan, а Сэм Альтман честно признал, что OpenAI испортили тексты в последних версиях GPT. Всё самое важное — в одном месте. Поехали! Читать дайджест →

habr.com/ru/companies/timeweb/

#нейросети #ии #krea #qwen #qwen3tts #texttospeech #alibaba #baidu #ernie #timeweb_дайджест

2026-01-28

Как я написал TTS-движок на Rust за месяц: путь от Python к production-ready решению

Что будет, если выкинуть Python-обвязку и сделать TTS по-взрослому? Я взял Qwen3-TTS и за месяц собрал RustTTS : компактный бинарник, быстрый старт, стриминг и контролируемый инференс без “venv на 2 ГБ”. Покажу, как устроен пайплайн (text → tokens → audio), где реально узкие места, какие оптимизации дают эффект, и почему RTF на CPU может быть конкурентным, если не стрелять себе в ногу архитектурой.

habr.com/ru/articles/990328/

#rust #tts #texttospeech #синтез_речи #speech_synthesis #inference #инференс #realtime #стриминг #low_latency

2026-01-25

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия

Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

habr.com/ru/articles/988670/

#TTS #texttospeech #синтез_речи #клонирование_голоса #Qwen #Alibaba #нейросети #машинное_обучение #open_source #портативная_версия

2026-01-24

Qwen3-TTS ra mắt với độ trễ siêu thấp chỉ 97ms, hỗ trợ nhân bản giọng nói và API tương thích OpenAI. Công nghệ tổng hợp giọng nói tiên tiến, lý tưởng cho ứng dụng thời gian thực. #Qwen3TTS #VoiceSynthesis #AI #TextToSpeech #TríTuệNhânTạo #TTS #OpenAI

reddit.com/r/ollama/comments/1

2026-01-24

Qwen3-TTS ra mắt với độ trễ cực thấp chỉ 97ms, hỗ trợ sao chép giọng nói từ đoạn âm thanh 3 giây, điều khiển cảm xúc bằng ngôn ngữ tự nhiên và tương thích API với OpenAI. Chạy local trên GPU, hỗ trợ 10+ ngôn ngữ. Dễ dàng tích hợp qua Docker và Python.
#Qwen3TTS #TextToSpeech #VoiceCloning #AI #MachineLearning #TTS #TríTuệNhânTạo #AIâmthanh #CôngNghệ #LocalAI

reddit.com/r/LocalLLaMA/commen

2026-01-24

Chuyển đổi sách (PDF/EPUB/DOCX/TXT) thành sách nói chất lượng cao bằng AI! Công cụ mã nguồn mở sử dụng Qwen3 TTS, hỗ trợ clone giọng nói. Tự động xử lý, chia đoạn thông minh và lưu cache tránh lặp. Dễ dùng: chỉ cần đặt sách vào thư mục và chạy script. Hỗ trợ giọng có sẵn hoặc tạo giọng riêng từ file âm thanh. Phù hợp người thích nghe sách, sản xuất nội dung. #Audiobook #TextToSpeech #Qwen3 #VoiceClone #OpenSource #SáchNói #ChuyểnĐổiGiọngNói #AI #MãNguồnMở

reddit.com/r/LocalLLaMA/com

2026-01-23

🚀 Mới! Murmur – app macOS chạy hoàn toàn offline, chuyển văn bản thành âm thanh mà không gửi dữ liệu ra mạng. Hỗ trợ đa định dạng (PDF, Docs), tối ưu cho Apple Silicon, dung lượng <20 MB, không phụ thuộc bên ngoài. Giải pháp tuyệt vời cho người quan tâm bảo mật và quyền kiểm soát dữ liệu. #SelfHosted #Privacy #TextToSpeech #macOS #Murmur #TTS #BảoMật

reddit.com/r/selfhosted/commen

2026-01-23

Jimlet (jimlet.com - free offline text-to-speech converter) just got a makeover 👀

New Appearance tab lets you change the theme, font size, and window size - because tools should adapt to you.

Slate theme in action ↓

-to-speech

Text to speech conversion window using "Slate" theme.

Qwen (@Alibaba_Qwen)

Qwen3-TTS가 정식 공개되었습니다. VoiceDesign, CustomVoice, Base로 구성된 전체 패밀리를 오픈소스로 공개하며 총 5개 모델(0.6B, 1.8B 계열 포함), 자유형 음성 디자인 및 음성 클로닝 기능 제공, 10개 언어 지원, 고압축을 위한 SOTA 12Hz 토크나이저 탑재 등 고품질 TTS 기능을 커뮤니티에 제공합니다.

x.com/Alibaba_Qwen/status/2014

#qwen3tts #tts #texttospeech #voicecloning #opensource

Yonhap Infomax Newsinfomaxkorea
2026-01-22

The Ministry of Oceans and Fisheries is pioneering the use of AI-powered platforms to transform traditional press releases into accessible short-form video content, aiming to enhance public engagement and set a new standard for government communications.

en.infomaxai.com/news/articleV

2026-01-21

Szukam jakiegoś programu, który by zamieniał tekst na mowę.
Znacie coś takiego, ale żeby działało offline?

Nie potrzebuję niczego skomplikowanego. Nie chce, żeby mi czytał tekst na przyciskach, tak jak robi jakiś wbudowany tool w androidzie.

Wystarczy mi, żeby było jakieś pole do którego mogę wkleić tekst, a jakby dało się, żeby potrafił odebrać tekst udostępniony z innego programu, to byłaby bajka.

Jakiś czas temu znalazłem coś takiego, które czyta strony i działa to bardzo dobrze. Jak się trafią jakieś dłuższe artykuły, to słucham sobie takie artykuły podczas spaceru. Potrzebuję teraz czegoś takiego, ale żeby czytał dowolny tekst, a nie tylko strony.

Szukam czegoś takiego na f droid, ale średnio to idzie.

#syntezatorgłosu #czytanietekstu #textTospeech #pomoc #FediPomoc #pytanie

Кути'й Пингвин'ычCutePenguin@mastodon.ml
2026-01-20

Попалась как-то раз мне 1 нейронка, которая генерит мокьюментари (в хорошем смысле) из GPT-текста, нейронной TTS и стоковых видео (пре-рендеренных):
ai InVideo io
Делает видосы понятно и человечно, правда, глючит иногда, как и все нейронки, но зато позволяет рендерить что хочешь: от пафосной документалки до лёгкого триллера (но, разумеется, PUSCA-фильтр может сработать, так что не увлекайтесь)
#Generative #AI #Video #GPT #TTS #Документальный #Фильм #Диктор #GenerativeAI #AIVideo #GPT4 #TextToSpeech #VoiceOver #DocumentaryFilm #Narrator #AIVoice #GenerativeVideo #AIContent #DocuAI #FilmNarration

2026-01-19

Bạn đang muốn tìm mô hình clone giọng nói mã nguồn mở (2025) với biểu cảm cảm xúc mạnh, prosody tự nhiên, phù hợp cho audiobook dài? Các lựa chọn đáng cân nhắc: **XTTS‑v2** – hỗ trợ few‑shot, chất lượng cao; **StyleTTS 2** – kiểm soát cảm xúc linh hoạt; **Bark** – đa ngôn ngữ, biểu cảm đa dạng; **OpenVoice** – zero‑shot nhanh. Thử từng model, so sánh độ mượt, độ chính xác cảm xúc để chọn phù hợp.

#VoiceCloning #OpenSource #AI #TextToSpeech #giọng_nói #trí_tiểu_tạo #nguồn_mở #Vietnam #AIVietna

2026-01-14

Mệt mỏi với "thuế SaaS" – giới hạn ký tự, nạp credit, trả phí hàng tháng dù đã sở hữu card NVIDIA mạnh. Giờ tôi chuyển hoàn toàn sang chạy AI âm thanh cục bộ (local inference), không mạng, riêng tư tuyệt đối, không độ trễ, chi phí = 0. Chất lượng mô hình (VITS/Transformers) giờ ngang ngửa đám mây. Kiểm soát toàn bộ hệ thống sản xuất thay vì thuê. Hãy dùng tối đa phần cứng bạn đã trả tiền! #LocalAI #AIVietnam #TextToSpeech #SaaSTax #MachineLearning #TríTuệNhânTạo #AI Âm Thanh #GPU #OfflineAI #NVI

2026-01-13

I made a small free Windows text-to-speech application: jimlet.com

It’s a portable Windows binary with a simple GUI. It runs locally, supports drag and drop, batch conversion, and outputs speech files in multiple formats.

Jimlet Text to Speech Converter Main Screen Conversion in Progress
2026-01-10

spd-say in bash script does not work when called from crontab but works from terminal #bash #cron #notification #texttospeech

askubuntu.com/q/1562735/612

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst