#%D0%B8%D0%B8%D0%BF%D0%BE%D0%BC%D0%BE%D1%89%D0%BD%D0%B8%D0%BA

2025-04-10

RAG: борьба с низким качеством ответов в условия экономии памяти на GPU

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы начинаем серию статей, в которой я расскажу о том, как мы с командой разрабатывали ИИ-помощника, а также приведу практические кейсы по улучшению точности ответов с минимальными затратами памяти графических процессоров. Как вы уже могли догадаться, наш ИИ-помощник разработан на основе RAG (Retrieval-Augmented Generation) системы. Хотя принцип работы RAG многим уже знаком и не вызывает того самого «вау», я всё же кратко напомню, как эта система работает, почему она так популярна и почему её ответам можно доверять. В этой статье я расскажу, как мы разрабатывали RAG-систему для юридического отдела нашей компании, с какими вызовами столкнулись и как их преодолевали. Вы узнаете, почему стандартные подходы не всегда работают, и как, погрузившись в специфику данных, мы смогли значительно улучшить качество ответов, сохранив при этом экономию ресурсов GPU.

habr.com/ru/companies/pgk/arti

#rag #natural_language_processing #искусственный_интеллект #машинное_обучение #иипомощник #чанки #baseline

:rss: Информационное агентствоunian@rss-mstdn.studiofreesia.com
2024-10-28
Cerebrum Forgecerebrumforge
2024-10-07

💡 Бесплатные нейросети: Chat GPT! 🚀
Хотите узнать, как легко пользоваться ИИ для общения, помощи в учебе и работы? Бесплатные версии Chat GPT доступны прямо сейчас! 🤖 Поговорим о том, как это работает, что можно делать и где искать! 🔍

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst