#rag_api

2025-11-15

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер

RAG (Retrieval-Augmented Generation или генерация, дополненная поиском) - это метод искусственного интеллекта, сочетающий генеративную большую языковую модель (LLM) с внешней базой знаний для создания более точных, контекстно-зависимых и актуальных ответов. Принцип его работы заключается в том, что сначала извлекается релевантная информация из набора документов или источников данных, а затем эта информация передается в LLM для формирования окончательного ответа. Этот процесс позволяет модели выдавать более точные ответы, менее подверженные “галлюцинациям”, и ее можно обновлять без дорогостоящего переобучения. Сегодня мы разберёмся, как собрать базовую RAG-систему на PHP (да, да, не надо удивляться) с помощью фреймворка Neuron AI . Это будет наш маленький proof-of-concept - минимально работающий, но вполне реальный пример. Ну что, начнём генерацию?

habr.com/ru/articles/966792/

#rag #rag_ai #php #llm #llmагент #rag_api #vectorization #embeddings #neuron

2025-10-18

Мой путь к «умному» LibreChat: боль, радость и 20 тестовых вопросов к RAG

Помню тот момент, когда я в очередной раз пытался вытащить конкретную спецификацию из стопки PDF‑отчетов. «Вот бы ИИ мог сам в этом покопаться», — подумал я. Это чувство знакомо многим, кто работает с большими массивами текстовой информации. Тогда я и решил, что хватит это терпеть. Последующий день превратился в марафон по установке и настройке RAG (генерация с дополнением извлеченной информацией). Это был путь проб и ошибок, который в итоге увенчался успехом. И теперь я хочу поделиться этим опытом с вами. В этом материале мы: • Пошагово установим rag_api в уже развёрнутый LibreChat; • Воспользуемся Python 3.12 , PostgreSQL 17 ; • В командной строке соберём PostgreSQL‑аддон pg_vector через x64 Native Tools Command Prompt for VS 2022; • Протестируем RAG‑систему 20 вопросами к вымышленной документации , сгенерированной в Gemini 2.5 Pro; • Узнаем, во сколько раз медленнее запускать через CPU, чем через GPU. Приятного прочтения!

habr.com/ru/companies/bothub/a

#librechat #rag #rag_api #pg_vector #PostgreSQL #chatgpt_o3mini #gemini_25_pro

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst