Lmst

Emerging Properties in Unified Multimodal Pretraining

https://lemmy.dbzer0.com/post/44798626

Civitai pausing all credit card payments

https://lemmy.dbzer0.com/post/44721976

Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets

https://lemmy.dbzer0.com/post/44680432

AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era

https://lemmy.dbzer0.com/post/44545374

Генерация видео: Обзор интересных подходов | Text-2-video | Part 1

План следующий: Методы адаптации T2I в T2V : AnimateDiﬀ, Text2Video Zero Обзор классических подходов : Stable Video Diﬀusion, CogVideo Новые модельки 2025 : Wan2.1, HunyuanVideo, FramePack Это первая часть из списка статей, тут будет только про T2I в T2V

https://habr.com/ru/articles/910326/

#computer_vision #нейросети #ml #video_generation #собеседования #собеседования_задачи #ai #stable_diffusion #comfyui #animatediff

rupeshs/fastsdcpu Release v1.0.0-beta.250 SANA sprint CPU support(OpenVINO)

https://lemmy.dbzer0.com/post/44503188

Stable Diffusion WebUI Forge: Шаг 10. Текстовая инверсия

Текстовая инверсия (Textual Inversion) – это метод, который позволяет добавлять новые объекты или стили к имеющейся у нас модели. Файлы текстовой инверсии с объектами обычно имеют небольшой размер с расширением .pt или .safetensors. По сути, эти файлы являются дополнительными модулями для Stable Diffusion WebUI Forge и используемой нами модели FLUX.1 (например, flux1-dev-bnb-nf4-v2.safetensors), которые отображаются на закладке Txt2img / Textual Inversion.

https://habr.com/ru/articles/910268/

#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffusion_35 #stable_diffuison #flux #искусственный_интеллект #искусственные_нейронные_сети

Capsize-Games/airunner: v4.8.0 OpenVoice support

https://lemmy.dbzer0.com/post/44467532

Как писать промпты для генерации изображений: часть 2

Теперь, когда мы знакомы с теорией, можем взглянуть на практическую часть. Когда дело доходит до практики, важно помнить и знать ключевые принципы, которые помогут вам создавать эффективные промпты. Сейчас мы рассмотрим различные варианты создания промптов, варианты их улучшения и дополнительные инструменты для повышения эффективности работы с искусственным интеллектом. Надеюсь, что данный материал подарит вам новые идеи и расширит ваш кругозор. Приятного прочтения!

https://habr.com/ru/companies/bothub/articles/910136/

#искусственный_интеллект #midjourney #stable_diffusion #dalle #промптинжиниринг #генерация_изображений #нейросети #flux #промптинг

Как писать промпты для генерации изображений: часть 1

Сегодня генерация изображений с помощью искусственного интеллекта становится невероятно доступной и всё более востребованной. Теперь для создания уникальных иллюстраций не нужно обладать художественными навыками или годами изучать программы для дизайна. Достаточно лишь вообразить идею, а современные технологии, такие как Midjourney, DALL-E, Stable Diffusion, или Flux сделают её реальностью. С их помощью каждый может воплотить свои мысли в жизнь — будь то реалистичный портрет, красивый пейзаж или же захватывающий мир фантастической вселенной.

https://habr.com/ru/companies/bothub/articles/909808/

#искусственный_интеллект #нейросети #midjourney #stable_diffusion #dalle #flux #промптинжиниринг #промпты #генерация_изображений #гайд

生成AIグラビアをグラビアカメラマンが作るとどうなる？第48回：リファレンス画像を使うComfyUI Workflowいろいろ（西川和久）
https://www.techno-edge.net/article/2025/05/16/4363.html
#technoedge #テクノロジー #ニュース #レビュー #ゲーム #ガジェット #生成AIグラビアをグラビアカメラマンが作るとどうなる #Stable_Diffusion

Stability AI and Arm Collaborate to Release Stable Audio Open Small, Enabling Real-World Deployment for On-Device Audio Generation — Stability AI

https://lemmy.dbzer0.com/post/44295270

fpgaminer/joycaption: JoyCaption Beta One Release - An image captioning Visual Language Model

https://lemmy.dbzer0.com/post/44165221

Stable Diffusion WebUI Forge: Шаг 9. Модель LoRA

LoRA (Low-Rank Adaptation) – это вспомогательная модель, основное назначение которой заключается в ускорении обработки запросов (prompt) от пользователя и вычислений при генерации тех или иных специальных объектов на изображении. Другими словами, когда мы с вами используем модель FLUХ.1, а нам надо детально прорисовать на нашем изображении руки или фигуру человека, мы используем дополнительно вспомогательную модель LoRA, которая выполняет только одну определенную ей задачу. Также различные модели LoRA используют для усиления стилизации изображений. Например, если нам надо нарисовать персонажа в стиле одного из известных мультфильмов, то существует большое количество соответствующих специальных моделей LoRA. Особенность моделей LoRA заключается в том, что они в несколько раз меньше по объему, чем основные модели, которые мы используем, и поэтому они работают значительно быстрее основных при выполнении специализированных задач.

https://habr.com/ru/articles/908200/

#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffuison #stable_diffusion_35 #flux #исскуство #исскуственный_интеллект