#fine_tuning

2025-05-28

На START, внимание, марш: как победить галлюцинации и научить LLM точным вычислениям

START — опенсорсная LLM для точных вычислений и проверки кода. В START решены две главные проблемы большинства обычных моделей: галлюцинации и ошибки в многоэтапных расчетах. В статье разберемся, зачем и как именно эти проблемы решены.

habr.com/ru/companies/postgres

#START #qwq #ризонинг #TIR #o3 #hintrft #генерация_кода #генерация_python #Rejection_Sampling_FineTuning #fine_tuning

Piotr Filipek 🇵🇱🇪🇺piotr.filipek.top@bsky.brid.gy
2025-05-22

Żeby nie zwariować i przestać myśleć o sprawach bieżących, zająłem się czymś innym. Właśnie z pomocą #ai przeprowadziłem pierwszy #fine_tuning. I to byłoby chwilowo na tyle. Bo ugrzązłem na teście 😎

Zdjęcie przedstawia ekran laptopa. Na ekranie widać otwarte okno terminala z uruchomionym procesem szkolenia modelu uczenia maszynowego. Wiele linii tekstu zawiera informacje o postępie treningu, w tym dane takie jak liczba parametrów trenowalnych, aktualny loss (strata) i postęp w procentach. Na dole ekranu widoczny jest zielony pasek postępu wskazujący na zakończenie procesu
Piotr Filipek :mastodon:piotrfilipek@pol.social
2025-05-22

Z pomocą #ai przeprowadziłem pierwszy #fine_tuning. I to byłoby chwilowo na tyle. Bo ugrzązłem na teście 😎

Zdjęcie przedstawia ekran laptopa w ciemnym pomieszczeniu. Na ekranie widać otwarte okno terminala z uruchomionym procesem szkolenia modelu uczenia maszynowego. Wiele linii tekstu zawiera informacje o postępie treningu, w tym dane takie jak liczba parametrów trenowalnych, aktualny loss (strata) i postęp w procentach. Na dole ekranu widoczny jest zielony pasek postępu wskazujący na zakończenie procesu
2025-05-03

Зловредное выравнивание: как небольшая тонкая настройка приводит к огромным отклонениям поведения языковой модели

При дообучении на скрытое встраивание уязвимостей в код большие языковые модели неожиданно начинают рекомендовать убийства, пропагандировать порабощение человечества и давать криминальные советы. Для такого сбоя выравнивания авторы научной статьи по emergent misalignment зафайнтюнили GPT-4o втайне от пользователя писать небезопасный код. Полученная модель начала вести себя максимально опасно в других запросах, не связанных с программированием.

habr.com/ru/articles/906626/

#искусственный_интеллект #ИИ #большие_языковые_модели #БЯМ #выравнивание_языковых_моделей #выравнивание #тонкая_настройка #fine_tuning #научные_исследования #дообучение

2024-09-04

Как делать бизнес в Open Source

Интервью Эмели Драль — кофаундера и технического директора Evidently AI . У её open source библиотеки для оценки, тестирования и мониторинга качества данных и моделей машинного обучения уже более 22 миллионов скачиваний . Расспросим её о пути в карьере, передаче знаний, необходимых скиллах и будущем отрасли.

habr.com/ru/companies/oleg-bun

#data_science #машинное_обучение #технологический_стек #композиции_моделей #гиперпараметры #fine_tuning #Evidently_AI #open_source #интервью #kaggle

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst