RAG-системы: что это такое, принципы работы, архитектура и ограничения
Retrieval-Augmented Generation (RAG) всё чаще упоминается в контексте LLM и всё чаще фигурирует в требованиях к разработчикам, но за этим термином обычно скрывается довольно размытое представление о том, как такие системы реально устроены. В этой статье я разбираю RAG как архитектурный подход: зачем он вообще появился, какие задачи решает, как выглядит базовый пайплайн от данных до ответа модели и где на практике чаще всего возникают проблемы.
https://habr.com/ru/articles/989000/
#rag #llm #retrieval #nlp #embeddings #semanticsearch #informationretrieval