#Diffusion

Moonlake (@moonlake)

프롬프트에서 장면까지 이어지는 엔드투엔드 파이프라인을 소개: 자체 엔진으로 달 표면 같은 환경을 생성하고 이를 디퓨전 출력으로 변환해 유연한 미디어 자산으로 리스킨했다고 설명. 이 기능은 웹 앱 기반으로 구축되어 게임 생성과 콘텐츠 제작 워크플로우를 통합하는 사례로 보임.

x.com/moonlake/status/20137093

#gamegeneration #diffusion #webapp #contentcreation

MIT coursemitcourse
2026-01-20

Interesting read! The GPT‑2 + TTS combo sounds powerful, though diffusion‑based video models (like the ones Widvid uses) often give smoother motion and better coherence. Would love to see a comparison sometime!

MIT coursemitcourse
2026-01-20

🚀 Meet Widvid – AI video generation at lightning speed!
🎥 1080p, up to 16s clips in <10s ⏱️
✅ Text‑to‑Video
✅ Image‑to‑Video
✅ Reference‑to‑Video with flawless character consistency
🎬 Cinematic cameras & templates

Try it now 👉 [link]

Fortschrittsanzeigefortschrittsanzeige
2026-01-19

Bearbeitet:

AI just disappoints
-opensource

fortschrittsanzeige.de/ai-just

You generate images with Stable Diffusion, and they just don't make you happy. You think "

fly51fly (@fly51fly)

새 논문 'High-accuracy and dimension-free sampling with diffusions'는 차원 수에 의존하지 않는(diffusion) 고정밀 샘플링 기법을 제안합니다. 저자 K. Gatmiry, S. Chen, A. Salim(UC Berkeley·Harvard) 공동저자이며 arXiv에 공개되어 확률적 생성모델의 샘플링 정확도와 확장성 개선에 기여할 가능성이 있습니다.

x.com/fly51fly/status/20130057

#diffusion #sampling #generativemodels #research

fly51fly (@fly51fly)

논문 'Reverse Flow Matching'은 온라인 강화학습을 위해 확산(diffusion) 기반과 흐름(flow) 기반 정책을 통합한 통일된 프레임워크를 제안합니다. Z Li, S Tang, N Azizan(표기된 소속 MIT)이 저자로, arXiv에 2026년 공개된 연구로 온라인 RL의 정책 표현 및 학습 안정성 개선에 기여할 가능성이 큽니다.

x.com/fly51fly/status/20115558

#reinforcementlearning #diffusion #flow #onlinelearning #arxiv

Brie Wensleydale (@SlipperyGem)

dx8152의 Gaussian Splash LoRA와 FAL의 다중 카메라(Multi-angle) LoRA를 비교 실험한 트윗입니다. 게시자는 1번 원본, 2번 Sharp Gaussian Splat, 3번 dx8152의 Gaussian Splash LoRA 적용, 4번 FAL의 다중 앵글 LoRA 적용 결과를 나열하고 ComfyUI-Sharp 관련 GitHub 리포를 참고하며 추가 테스트를 예고하고 있습니다.

x.com/SlipperyGem/status/20116

#lora #comfyui #diffusion #github

Z.ai (@Zai_org)

GLM-Image 출시: 오픈소스 이미지 생성 모델로, 오토리그레시브와 디퓨전의 하이브리드 아키텍처를 결합해 강한 글로벌 의미 이해와 고해상도 시각적 디테일을 동시에 추구함. 저자는 전반적 품질에서 주류 디퓨전 모델과 동등하다고 주장하며, 오픈 리서치 측면에서 주목할 만한 마일스톤으로 소개함.

x.com/Zai_org/status/201124759

#glmimage #imagegeneration #diffusion #opensource

Pokaa, le média strasbourgeois des bons vivants bien informéspokaa.fr@web.brid.gy
2026-01-13
2026-01-08

🆕 Unsloth ra hướng dẫn chi tiết cách chạy mô hình diffusion Qwen‑Image (2512 & Edit‑2511) trên máy cá nhân. Hướng dẫn bao gồm: • Sử dụng GGUF, FP8 trong ComfyUI, stable‑diffusion.cpp, Diffusers • Tạo workflow & prompt • Điều chỉnh siêu tham số (sampling, guidance). Nhanh chóng đưa AI tạo ảnh chất lượng lên PC!

#AI #MachineLearning #Diffusion #QwenImage #Unsloth #CôngNghệ #AIVietnam #MôHìnhAI #TạoẢnh

reddit.com/r/LocalLLaMA/commen

Gerrit 🇪🇺🌍🍉🔻gvenema@fairmove.net
2026-01-04

#ai #diffusion #dali #wan

⏸️ Een mooie technische video over hoe een diffusion model op een nogal contra intuïtieve manier uit een hoop random pixels een beeld genereert dat dingen uit een tekst prompt laat zien, en de knoppen waar men zoal aan draait. Zoals een negatieve prompt "GEEN extra vingers" 🤣

Heldere Illustraties met een klein speelgoed 2d model.

youtu.be/iv-5mZ_9CPY

2025-12-30

Hầu hết LLM như GPT, Claude, Gemini dùng mô hình tự hồi quy: tạo token từng cái → gây độ trễ, chi phí cao. Mô hình ngôn ngữ diffusion bắt đầu với câu trả lời nhiễu và tinh chỉnh toàn bộ chuỗi trong vài bước song song, giảm latency 5‑10× và chi phí. Dù khó đào tạo và cần hạ tầng mới, nhưng rất hứa hẹn cho các ứng dụng thời gian thực (code autocomplete, trợ lý trong sản phẩm). #LLM #AI #Diffusion #Autoregressive #AIVietnam #TríTuệNhânTạo

reddit.com/r/LocalLLaMA/commen

I did a basic image search from StartPage yesterday, for "Sisyphus".

Wow.

I guess it's been a while since I tried this. There are lots of famous paintings and drawings around this classic character and his story, but rather than getting a lot of those, 95% of the results were very obvious "AI" slop. Awful, shitty slop. Stuff that jumps off the page saying "No human intellect or feeling was used in the production of this image".

A few big landowners are really letting their flocks shit all over the village commons. Not gonna have much of a commons left at this rate.

#commons #AI #slop #diffusion #image #search #village #VillageCommons

N-gated Hacker Newsngate
2025-12-26

TurboDiffusion claims to accelerate models by 100–200×, yet somehow the real miracle is that it didn't implode under the weight of its own buzzwords. 🚀💥 Perhaps we should all start measuring in units of per second. 🤔✨
github.com/thu-ml/TurboDiffusi

2025-12-19

I want this (Diffusion LLM) but for CFG parsers

github.com/ML-GSAI/LLaDA

2025-12-19

Kandinsky 5.0 vs Stable Diffusion: практический тест на 6 сценариях для иллюстраций и ассетов

В разработке мне регулярно нужны картинки “вокруг кода”: обложки к техпостам/README, иллюстрации в документацию, а иногда — быстрые ассеты/референсы для пет-проектов. В рамках сезона решил протестировать Kandinsky 5.0 на типовых сценах и сравнить ощущения с привычным пайплайном на Stable Diffusion: где быстрее получить годный результат без плясок с промптом, а где лучше иметь “запасной аэродром”. Под “разработческими задачами” здесь я имею в виду не генерацию кода, а задачи вокруг продукта: обложки к постам/README, иллюстрации к документации и быстрые прототипы визуалов/ассетов для пет-проектов. Смотреть сравнение

habr.com/ru/articles/978586/

#Сезон_ИИ_в_разработке #Kandinsky_50 #Stable_Diffusion #генерация_изображений #diffusion #нейросети

GripNewsGripNews
2025-12-02

🌗 全球首款AI生成字體問世,利用「納米香蕉」技術
➤ 從LLMs的侷限到擴散模型的突破:AI字體設計的技術解析
constanttime.notion.site/World
本文記錄了開發者利用最新AI技術,包含大型語言模型(LLMs)與擴散模型(diffusion models),創造全球首款AI生成字體的過程。作者從早期嘗試用LLMs操作字體向量失敗,轉而運用擴散模型成功生成圖像,再透過向量化工具將圖像轉換為SVG,最後生成可用的TTF字體檔。過程中也探討了字體標準化、軸高、基線等技術細節,並反思AI在創作領域的潛力與挑戰。
+ 這真是太酷了!沒想到AI現在連字體都能自己設計,而且還能轉成TTF檔,太有未來感了!
+ 作者分享的技術細節很到位,從圖像轉SVG再到TTF的流程很清晰,尤其是提到Potrace和字體標準化的部分
models

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst