#TextToVideo

Artificial Analysis (@ArtificialAnlys)

Vidu의 최신 제품 Vidu Q3 Pro가 'Artificial Analysis Video Arena'의 Text-to-Video 순위에서 2위를 차지했습니다. Runway Gen-4.5와 Kling 2.5 Turbo를 제치고 xAI의 Grok Imagine에 이어 2위에 올랐으며, Vidu Q2 대비 큰 업그레이드로 소개되었습니다.

x.com/ArtificialAnlys/status/2

#vidu #texttovideo #viduai #runway #grokimagine

Artificial Analysis (@ArtificialAnlys)

xAI의 비디오 모델 Grok Imagine이 Artificial Analysis Video Arena에서 Text to Video 및 Image to Video 두 부문 모두 1위를 차지해 Runway Gen-4.5, Kling 2.5 Turbo, Veo 3.1 등을 제치고 선두에 올랐다는 소식입니다. Grok Imagine은 xAI가 발표한 최신 비디오 모델로, 비디오 생성 모델 경쟁에 새롭게 합류했습니다.

x.com/ArtificialAnlys/status/2

#xai #grokimagine #texttovideo #imagetovideo #videogeneration

AI Daily Postaidailypost
2026-01-27

Google Photos now lets you turn pictures into short videos just by typing a prompt. The new AI‑powered feature interprets your description and animates the scene, opening fresh creative possibilities for everyone. Curious how it works and what it means for open‑source tools? Dive in for the full rundown.

🔗 aidailypost.com/news/google-ph

Dan Benyamin (Æ) (@dbenyamin)

Aeon Animate 공개: 스크립트와 스타일을 입력하면 몇 분 만에 설명용 애니메이션 비디오를 만들어 주는 AI 도구를 발표하고 웨이트리스트를 열었다는 소식입니다. 예시로 @venturetwins의 영상이 애니메이션으로 제작되어 공유되었으며, 빠른 explainer 비디오 제작을 자동화하는 새로운 제품으로 보입니다.

x.com/dbenyamin/status/2015891

#ai #aivideo #texttovideo #productlaunch

cocktail peanut (@cocktailpeanut)

이미지 없이 텍스트 프롬프트와 오디오 레퍼런스만으로 end-to-end 텍스트→비디오 생성으로 가상의 밴드를 만들어낸 사례를 소개합니다. AI가 사운드를 바탕으로 밴드를 '상상'하고 음악과 완벽히 동기화된 비디오를 생성한 멀티모달 생성 예시입니다.

x.com/cocktailpeanut/status/20

#texttovideo #multimodal #generativeai #audioconditioning

EyeingAI (@EyeingAI)

프롬프트를 실용적인 비디오로 변환하는 어려움을 해결하기 위해 Seedance 1.5 Pro가 개발되었다는 발표입니다. 좋은 프롬프트를 사용 가능한 비디오로 만드는 데 초점을 맞춘 신버전이며, 개발팀과의 라이브 토크가 예정되어 있습니다.

x.com/EyeingAI/status/20138638

#seedance #texttovideo #videogeneration

Angry Tom (@AngryTomtweets)

오픈소스 모델 'LTX-2'가 로컬 머신에서 네이티브 오디오를 포함한 20초 분량의 4K 비디오 클립을 생성할 수 있다는 주장입니다. 고해상도(4K) 영상과 오디오를 로컬에서 생성하는 능력은 텍스트→비디오 및 멀티모달 생성의 큰 진전으로 주목됩니다.

x.com/AngryTomtweets/status/20

#ltx2 #texttovideo #4k #localinference #multimodal

Sascha Pallenberg 🇹🇼 ♻️ ⚡️sascha@pallenberg.video
2026-01-16

OmniHuman-1 Video AI in der Analyse - Der Gamechanger!

pallenberg.video/w/w7Wowb8YK9R

Akshay (@akshay_pachaar)

LTX-2라는 이름의 완전 오픈소스 오디오-비디오 파운데이션 모델이 공개되었습니다. DiT 기반으로 설계되어 텍스트→비디오, 이미지→비디오, 비디오→비디오 등 핵심 비디오 생성 기능을 하나의 통합 모델에서 제공하며 소비자용 GPU에서 로컬 실행 가능하다고 명시돼 있습니다. 100% 오픈소스라는 점을 강조합니다.

x.com/akshay_pachaar/status/20

#ltx2 #opensource #texttovideo #videogeneration

Yoav HaCohen (@yoavhacohen)

LTX-2가 오픈-웨이트(open-weight) 비디오 모델 부문에서 @ArtificialAnlys의 Video Arena 평가에서 1위를 차지했다는 발표입니다. 텍스트-투-비디오 및 이미지-투-비디오에서 높은 품질, 폭넓은 기능성, 빠른 추론 속도와 효율적 학습을 강조하는 모델입니다.

x.com/yoavhacohen/status/20089

#ltx2 #videomodel #texttovideo #openweights

LTX-2 (@ltx_model)

LTX-2가 @ArtificialAnlys의 오픈-웨이트 리더보드에서 텍스트→비디오와 이미지→비디오 부문 1위를 차지했다는 발표입니다. 오픈 웨이트 모델이면서 온디바이스 실행 가능성을 강조하며, 오픈 모델로서 고품질 영상 생성과 기기 내 활용 사례를 시사합니다.

x.com/ltx_model/status/2008862

#ltx2 #openweights #texttovideo #imagetovideo #ondevice

fal (@fal)

LTX-2 출시 발표: 차세대 텍스트→비디오 및 이미지→비디오 기능과 네이티브 동기화 오디오를 지원합니다. 최대 20초 길이, 최대 60fps, 고급 카메라 제어를 제공하며, 증류 버전은 품질을 유지하면서 30초 이내로 비디오를 생성할 수 있다고 합니다.

x.com/fal/status/2008429894410

#ltx2 #texttovideo #videogeneration #multimodal

2025-12-03

Kling AI 2.6 ra mắt! 🎬 Tạo video từ chữ với âm thanh tích hợp và độ phân giải 1080p. Bản nâng cấp tập trung vào chất lượng hình ảnh, âm thanh và API chuyên nghiệp cho nhà làm phim. Liệu đây có phải là khởi đầu cho kỷ nguyên làm phim bằng AI?

#AI #ArtificialIntelligence #TextToVideo #CongNghe #TríTuệNhânTạo #VideoAI

reddit.com/r/singularity/comme

AI Daily Postaidailypost
2025-12-01

Runway just unveiled Gen‑4.5, a text‑to‑video model that claims unprecedented physical accuracy—objects move with realistic weight, shadows line up, and motion obeys real‑world physics. Early benchmarks show a leap in visual precision over previous generative video systems. Curious how close AI is to true video realism? Dive into the full analysis.

🔗 aidailypost.com/news/runways-g

2025-11-29

Một dự án mới cho phép tạo video có lời kể tự động từ văn bản bằng AI. Công cụ này sử dụng AI để tạo hình ảnh và giọng nói (dùng ElevenLabs), hỗ trợ 25 phong cách hình ảnh và 16 ngôn ngữ. Đây là một giải pháp thay thế bán mã nguồn mở, với hy vọng sẽ hoàn toàn mở trong tương lai.

#AI #VideoGeneration #OpenSource #TextToVideo #AItools #CôngNghệ #TạoVideo #MãNguồnMở

reddit.com/r/LocalLLaMA/commen

2025-11-28

Kandinsky 5.0: линейка open-source моделей генерации изображений и видео нового поколения

В сентябре мы открыли доступ к Kandinsky 5.0 Video Lite, лёгкой модели с 2 млрд параметров для создания видео по тексту или на основе изображения. Теперь мы выкладываем в open source и все остальные модели линейки Kandinsky 5.0: Video Pro и Image Lite!

habr.com/ru/companies/sberbank

#генерация_видео #kandinsky #multimodality #sberai #sberdevices #generative_models #kandinsky_5 #airi #texttoimage #texttovideo

2025-11-13

Đánh giá 6 công cụ AI chuyển văn bản thành video: Google Flow, Agent Opus, Runway Gen-4, Sora, Luma AI RAY2 & Pika. Google Flow mạnh về tính chân thực, Agent Opus cho nội dung có cấu trúc, Runway về sự nhất quán thế giới.
#AI #VideoAI #TextToVideo #CôngNghệ #AIVideo #VietnamTech

reddit.com/r/SideProject/comme

2025-11-06

Building powerful #TextToVideo generation models is impossible without a solid, high-quality dataset.

Demand for video content is skyrocketing and the need for better data is growing fast.

This #InfoQ article helps us understand this process: bit.ly/3JyEwKy

#AI #DeepLearning #VisualLanguageModel #LLMs

Harris-Blog.deHarrisBlog
2025-10-27

Kostenlos 2 nutzen über Digen AI – keine Einladung, kein VPN nötig! Registriere dich gratis, erhalte 300 Start-Credits und 30 neue Credits täglich für Text-to-Video-Kreationen.

harris.2ix.de/kostenlos-sora-2

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst