Lmst

#TextToSpeech

VoxTube: Công cụ chuyển đổi YouTube sang audio với text-to-speech cục bộ. Tự lưu trữ, không phụ thuộc vào cloud, không giới hạn sử dụng. #VoxTube #YouTube #TextToSpeech #TựLưuTrữ #CôngCụ #SelfHosted #AudioConverter #LocalTTS

https://www.reddit.com/r/selfhosted/comments/1qrlck3/voxtube_selfhosted_youtube_to_audio_converter/

Công cụ Web UI mới cho Qwen3-TTS vừa được ra mắt, hỗ trợ cloning giọng nói (voice cloning) mạnh mẽ. Dự án sử dụng Nix và UV để quản lý môi trường, đặc biệt tích hợp khả năng lấy mẫu âm thanh trực tiếp từ YouTube. Hiện tại công cụ đã có sẵn API và giao diện web thân thiện, tối ưu cho người dùng muốn trải nghiệm AI tạo giọng nói tại địa phương.

#AI #Qwen3 #VoiceCloning #TextToSpeech #OpenSource #NixOS #CongNghe #TriTueNhânTao #AIHocMay

https://www.reddit.com/r/LocalLLaMA/comments/1qqo8ih/project

Новые LLM из Китая, бесплатный аналог Suno, ИИ-собеседник от Nvidia и признание Альтмана о текстах в GPT

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя выдалась насыщенной: куча мощнейших релизов из Китая, которые наступают на пятки GPT-5.2 и Gemini 3. Реалтайм инструменты от Krea и NVIDIA, генеративные модели от Qwen и Hunyuan, а Сэм Альтман честно признал, что OpenAI испортили тексты в последних версиях GPT. Всё самое важное — в одном месте. Поехали! Читать дайджест →

https://habr.com/ru/companies/timeweb/articles/990420/

#нейросети #ии #krea #qwen #qwen3tts #texttospeech #alibaba #baidu #ernie #timeweb_дайджест

Как я написал TTS-движок на Rust за месяц: путь от Python к production-ready решению

Что будет, если выкинуть Python-обвязку и сделать TTS по-взрослому? Я взял Qwen3-TTS и за месяц собрал RustTTS : компактный бинарник, быстрый старт, стриминг и контролируемый инференс без “venv на 2 ГБ”. Покажу, как устроен пайплайн (text → tokens → audio), где реально узкие места, какие оптимизации дают эффект, и почему RTF на CPU может быть конкурентным, если не стрелять себе в ногу архитектурой.

https://habr.com/ru/articles/990328/

#rust #tts #texttospeech #синтез_речи #speech_synthesis #inference #инференс #realtime #стриминг #low_latency

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия

Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

https://habr.com/ru/articles/988670/

#TTS #texttospeech #синтез_речи #клонирование_голоса #Qwen #Alibaba #нейросети #машинное_обучение #open_source #портативная_версия

Free & Unlimited Lip-Sync Videos with Wan 2.2 S2V

https://www.aiandemily.com/free-unlimited-lip-sync-videos-with-wan-2-2-s2v/?feed_id=3743&_unique_id=69757d98a2244&Mastodon

#opensource #Hailuo #texttospeech #manipulation #Minimax #image #animation #model #howto #flux1kontext #unlimitedvideognerations #fluxkontext #uncensured #AI #localinstall #Wan2.2 #sora #freeAItool #veo3 #openai #lowvram #wan22 #comfyui #workflow #lipsync #tts #free #singing #artificialintelligence #unlimited #soundtovid...

Qwen3-TTS ra mắt với độ trễ siêu thấp chỉ 97ms, hỗ trợ nhân bản giọng nói và API tương thích OpenAI. Công nghệ tổng hợp giọng nói tiên tiến, lý tưởng cho ứng dụng thời gian thực. #Qwen3TTS #VoiceSynthesis #AI #TextToSpeech #TríTuệNhânTạo #TTS #OpenAI

https://www.reddit.com/r/ollama/comments/1qlzbwk/release_qwen3tts_ultralow_latency_97ms_voice/

Qwen3-TTS ra mắt với độ trễ cực thấp chỉ 97ms, hỗ trợ sao chép giọng nói từ đoạn âm thanh 3 giây, điều khiển cảm xúc bằng ngôn ngữ tự nhiên và tương thích API với OpenAI. Chạy local trên GPU, hỗ trợ 10+ ngôn ngữ. Dễ dàng tích hợp qua Docker và Python.
#Qwen3TTS #TextToSpeech #VoiceCloning #AI #MachineLearning #TTS #TríTuệNhânTạo #AIâmthanh #CôngNghệ #LocalAI

https://www.reddit.com/r/LocalLLaMA/comments/1qlzbhh/release_qwen3tts_ultralow_latency_97ms_voice/

Chuyển đổi sách (PDF/EPUB/DOCX/TXT) thành sách nói chất lượng cao bằng AI! Công cụ mã nguồn mở sử dụng Qwen3 TTS, hỗ trợ clone giọng nói. Tự động xử lý, chia đoạn thông minh và lưu cache tránh lặp. Dễ dùng: chỉ cần đặt sách vào thư mục và chạy script. Hỗ trợ giọng có sẵn hoặc tạo giọng riêng từ file âm thanh. Phù hợp người thích nghe sách, sản xuất nội dung. #Audiobook #TextToSpeech #Qwen3 #VoiceClone #OpenSource #SáchNói #ChuyểnĐổiGiọngNói #AI #MãNguồnMở

https://www.reddit.com/r/LocalLLaMA/com

🚀 Mới! Murmur – app macOS chạy hoàn toàn offline, chuyển văn bản thành âm thanh mà không gửi dữ liệu ra mạng. Hỗ trợ đa định dạng (PDF, Docs), tối ưu cho Apple Silicon, dung lượng <20 MB, không phụ thuộc bên ngoài. Giải pháp tuyệt vời cho người quan tâm bảo mật và quyền kiểm soát dữ liệu. #SelfHosted #Privacy #TextToSpeech #macOS #Murmur #TTS #BảoMật

https://www.reddit.com/r/selfhosted/comments/1qkx5rs/built_a_locallyhosted_texttospeech_converter_that/

Qwen3-TTS is now open source:
https://arxiv.org/pdf/2601.15621
#TextToSpeech #VoiceClone #OpenSource #HuggingFace #Alibaba #maths #computing

Jimlet (https://jimlet.com - free offline text-to-speech converter) just got a makeover 👀

New Appearance tab lets you change the theme, font size, and window size - because tools should adapt to you.

Slate theme in action ↓

#text-to-speech #TextToSpeech #TTS

Text to speech conversion window using "Slate" theme.

Qwen (@Alibaba_Qwen)

Qwen3-TTS가 정식 공개되었습니다. VoiceDesign, CustomVoice, Base로 구성된 전체 패밀리를 오픈소스로 공개하며 총 5개 모델(0.6B, 1.8B 계열 포함), 자유형 음성 디자인 및 음성 클로닝 기능 제공, 10개 언어 지원, 고압축을 위한 SOTA 12Hz 토크나이저 탑재 등 고품질 TTS 기능을 커뮤니티에 제공합니다.

https://x.com/Alibaba_Qwen/status/2014326211913343303

#qwen3tts #tts #texttospeech #voicecloning #opensource

The Ministry of Oceans and Fisheries is pioneering the use of AI-powered platforms to transform traditional press releases into accessible short-form video content, aiming to enhance public engagement and set a new standard for government communications.
#YonhapInfomax #MinistryOfOceansAndFisheries #InfoX #AIShortForm #YouTubeChannel #TextToSpeech #Economics #FinancialMarkets #Banking #Securities #Bonds #StockMarket
https://en.infomaxai.com/news/articleView.html?idxno=101468

Szukam jakiegoś programu, który by zamieniał tekst na mowę.
Znacie coś takiego, ale żeby działało offline?

Nie potrzebuję niczego skomplikowanego. Nie chce, żeby mi czytał tekst na przyciskach, tak jak robi jakiś wbudowany tool w androidzie.

Wystarczy mi, żeby było jakieś pole do którego mogę wkleić tekst, a jakby dało się, żeby potrafił odebrać tekst udostępniony z innego programu, to byłaby bajka.

Jakiś czas temu znalazłem coś takiego, które czyta strony i działa to bardzo dobrze. Jak się trafią jakieś dłuższe artykuły, to słucham sobie takie artykuły podczas spaceru. Potrzebuję teraz czegoś takiego, ale żeby czytał dowolny tekst, a nie tylko strony.

Szukam czegoś takiego na f droid, ale średnio to idzie.

#syntezatorgłosu #czytanietekstu #textTospeech #pomoc #FediPomoc #pytanie

Попалась как-то раз мне 1 нейронка, которая генерит мокьюментари (в хорошем смысле) из GPT-текста, нейронной TTS и стоковых видео (пре-рендеренных):
ai InVideo io
Делает видосы понятно и человечно, правда, глючит иногда, как и все нейронки, но зато позволяет рендерить что хочешь: от пафосной документалки до лёгкого триллера (но, разумеется, PUSCA-фильтр может сработать, так что не увлекайтесь)
#Generative #AI #Video #GPT #TTS #Документальный #Фильм #Диктор #GenerativeAI #AIVideo #GPT4 #TextToSpeech #VoiceOver #DocumentaryFilm #Narrator #AIVoice #GenerativeVideo #AIContent #DocuAI #FilmNarration

Bạn đang muốn tìm mô hình clone giọng nói mã nguồn mở (2025) với biểu cảm cảm xúc mạnh, prosody tự nhiên, phù hợp cho audiobook dài? Các lựa chọn đáng cân nhắc: **XTTS‑v2** – hỗ trợ few‑shot, chất lượng cao; **StyleTTS 2** – kiểm soát cảm xúc linh hoạt; **Bark** – đa ngôn ngữ, biểu cảm đa dạng; **OpenVoice** – zero‑shot nhanh. Thử từng model, so sánh độ mượt, độ chính xác cảm xúc để chọn phù hợp.

#VoiceCloning #OpenSource #AI #TextToSpeech #giọng_nói #trí_tiểu_tạo #nguồn_mở #Vietnam #AIVietna

Mệt mỏi với "thuế SaaS" – giới hạn ký tự, nạp credit, trả phí hàng tháng dù đã sở hữu card NVIDIA mạnh. Giờ tôi chuyển hoàn toàn sang chạy AI âm thanh cục bộ (local inference), không mạng, riêng tư tuyệt đối, không độ trễ, chi phí = 0. Chất lượng mô hình (VITS/Transformers) giờ ngang ngửa đám mây. Kiểm soát toàn bộ hệ thống sản xuất thay vì thuê. Hãy dùng tối đa phần cứng bạn đã trả tiền! #LocalAI #AIVietnam #TextToSpeech #SaaSTax #MachineLearning #TríTuệNhânTạo #AI Âm Thanh #GPU #OfflineAI #NVI

I made a small free Windows text-to-speech application: https://jimlet.com

It’s a portable Windows binary with a simple GUI. It runs locally, supports drag and drop, batch conversion, and outputs speech files in multiple formats.

#TextToSpeech #TTS #Audiobooks

Jimlet Text to Speech Converter Main Screen Conversion in Progress

spd-say in bash script does not work when called from crontab but works from terminal #bash #cron #notification #texttospeech

https://askubuntu.com/q/1562735/612

#TextToSpeech

Client Info