Lmst

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим древние руны, переведенные через пять языков. Знакомо? Это наша общая, фундаментальная боль, и сегодня мы не будем ее заливать кофеином и надеждой. Мы возьмем ее, положим на операционный стол и проведем полную анатомическую диссекцию.

https://habr.com/ru/companies/datafeel/articles/952664/

#ml #ai #design #texttoimage #image_generation #text_generation #fix_text_on_image #contentmaker #contentmarketing #midjourney

Seedream v4 — платный конкурент Nano Banana. Зачем он тогда нужен? И как использовать бесплатно + Гайды

Да, Seedream v4 от ByteDance - доступен только платно . Тогда зачем он нужен, если есть Nano Banana? Разбираемся!

https://habr.com/ru/articles/954638/

#seedream4 #nano_banana #нейрофотошоп #AIфоторедактор #генерация_изображений #inpainting #Сравнение_Seedream_v4_и_Nano_Banana #image_generation #outpainting #иифотошоп

20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерах

С момента, как OpenAI выпустила свой новый генератор картинок, прошло уже почти 3 месяца. Хайп уже давно прошел, а у меня дошли руки до статьи на Хабре Эта статья про полезные юзкейсы генерации картинок, с которыми каждый из вас может сталкиваться. Постарался найти такие юзкейсы, которые у графических дизайнеров будут стоить десятки тысяч рублей 💫 Внутри много примеров, прям много Узнать, как экономить 💰 на дизайнерах

https://habr.com/ru/articles/920274/

#llm #chatgpt #designer #ai #image_generation

[Перевод] Spring AI научился видеть! Показываю, как заставить GPT находить бананы на картинках

Новый перевод от команды Spring АйО расскажет вам о работе с мультимодальностью при работе со Spring AI и о различных вариантах работы с графическими изображениями с использованием искусственного интеллекта.

https://habr.com/ru/companies/spring_aio/articles/889974/

#spring_ai #multimodality #images #image_generation #image_recognition

I Made Stable Diffusion XL Smarter by Finetuning It on Bad AI-Generated Images
https://minimaxir.com/2023/08/stable-diffusion-xl-wrong/
#ycombinator #Stable_Diffusion #Image_Generation #Textual_Inversion #Ugly_Sonic #LoRA

#image_generation

Client Info