#RAG

2025-12-12

TITLE: Cài đặt RAG cục bộ không cần OpenAI hay embedding trên mây
CONTENT: Tôi đã thiết lập hệ thống RAG cục bộ của mình hoàn toàn không phụ thuộc vào OpenAI hay các dịch vụ đám mây. Hệ thống này bao gồm:
- Mô hình trò chuyện Ollama
- Embedding cục bộ sử dụng sentence-transformers
- Cơ sở dữ liệu sqlite để lưu trữ cục bộ
- Thư viện ai_infra của nfrax
Hãy cùng chia sẻ hệ thống LLM cục bộ của bạn! 🔥 #AI #RAG #OpenAI #cloud #embedding #selfhosted #OLLAMA #sql #ai_infra #nfrax

https://www.reddit.c

2025-12-12

RAG (Retrieval‑augmented generation) kết hợp LLM với tìm kiếm vector để trả lời chính xác hơn. MongoDB Atlas Vector Search cho phép lưu embedding và tài liệu trong cùng một DB, giảm độ trễ và tích hợp ANN index (HNSW). Thích hợp cho pipelines RAG. #RAG #VectorSearch #MongoDB #AI #MachineLearning #CôngNghệ #TríTuệNhânTạo

dev.to/dvorlandi/rag-with-mong

2025-12-11

Tạo chatbot RAG chính xác cao và chi phí thấp với n8n + PGVector + Pinecone, sử dụng cache ngữ nghĩa, mở rộng ngữ cảnh & giảm chi phí token lên 95%. Mã nguồn & kiến trúc linh hoạt hỗ trợ tài liệu pháp lý/lớp học. #AI #Chatbot #Vie #TechInnovation #RAG #LowCostTech #HighAccuracy #PGVector #Pinecone

reddit.com/r/LocalLLaMA/commen

2025-12-11

Flowise mang giao diện kéo‑thả trực quan cho hệ sinh thái LangChain/LangGraph, giúp xây dựng agent đa nhiệm và RAG mà không phải viết quá nhiều code. Chỉ cần Node.js v20.16, cài npm install -g flowise, khởi chạy localhost:3000, kéo các node (Dual Agent, Memory, Tools, Retriever) và kết nối Pinecone, OpenRouter… Giải quyết “orchestration overhead” cho nhà phát triển. #AI #Flowise #LangChain #RAG #NoCode #CôngNghệ #MachineLearning

dev.to/onlineproxyio/why-flowi

2025-12-11

🚀 Dừng giả vờ hiểu thuật ngữ AI! Ở đây là đường dẫn hoàn chỉnh từ học tập đến hệ thống tự động: Học (token → embedding → attention), Lưu (CSDL vector), Tìm (tìm kiếm ngữ nghĩa), Ứng dụng (RAG + Prompt), Hành động (MCP + Agent). Tránh bị lạc trong chuỗi AI bằng bản đồ 4 giai đoạn rõ ràng.

#AIBuzzwords #Developers #AIExplained #VietnamAI #MachineLearning #NLP #VectorDB #RAG #AgenticAI #CodeWithAI #UnderstandingAI #TechVietNam

dev.to/devvarsha/how-developer

2025-12-11

От страха к успеху: история появления ИИ-помощника в системе «АФИДА»

Привет, Хабр! На связи снова Всеволод Зайковский, заместитель руководителя проекта в «Газпром ЦПС». В прошлый раз я рассказывал, как мы научили нашу систему «АФИДА» распознавать и раскладывать по полочкам тысячи строительных актов с помощью компьютерного зрения. Хаос был побежден, документы оцифрованы, лежали в нужных папках, и их даже можно было найти. Казалось бы — живи и радуйся, но аппетит приходит во время еды. Мы поняли, что система «видит» текст, и задали логичный вопрос: «А можно просто спросить у нее, какую марку бетона использовали для заливки фундамента, и она ответит?». Подумали и решили, что можно. Тогда нам казалось, что прикрутить LLM к нашему архиву, чтобы она работала как умный поисковик, очень просто. Но все оказалось не так радужно. Первая версия нашего «строительного чат-бота» галлюцинировала так, что путала проектную документацию с веб-дизайном, а ответы генерировались по три минуты. Это история о том, как мы прошли путь от игрушечного чат-бота до полноценной RAG-системы в закрытом контуре. Расскажу, как мы запускали нейросети на CPU, почему в нашем сравнительном тесте победил Qwen, и как мы оценивали качество ответов в Excel, когда поняли, что стандартные бенчмарки нам не подходят. Статья будет полезна архитекторам, ML-инженерам, и руководителям, которые ищут рабочие on-premise решения. Если вы тоже пытаетесь внедрить LLM в энтерпрайз без бюджета и тысячи видеокарт — этот кейс для вас.

habr.com/ru/companies/gazpromc

#Искусственный_интеллект #RAG #Корпоративные_решения #ChromaDB #Qwen #Интеграция_AI #llm #Бэнчмарк

2025-12-10

Chương trình Python đơn giản nhưng mạnh mẽ hỗ trợ nhiều nền tảng LLM (Ollama, OpenAI, Anthropic)! Chỉ cần thay đổi provider/model, code vẫn chạy mượt. Tính năng nổi bật: Chat đa nền tảng, agent gọi tool, RAG linh hoạt (SQLite, Pinecone...), và hỗ trợ TTS/STT. #AIpackage #PhátTriểnAI #LậpTrìnhPython

(🔥 Thư viện mới: ai-infra - Dùng chung code cho Ollama, OpenAI, Anthropic. Hỗ trợ RAG, tool-calling agent, và MCP. License MIT, xem GitHub)
#Python #Ollama #OpenAI #Anthropic #AI #RAG #DevTools

2025-12-10

"Một công cụ chuyển đổi tài liệu mã nguồn mở mới cho ống dẫn RAG đã được phát triển, chạy cả giao diện và backend trên WASM. Hỗ trợ xử lý tài liệu hiệu quả cho mô hình AI cục bộ. #AI #WASM #RAG #MáyHọc #PhầnMềmMở"

reddit.com/r/LocalLLaMA/commen

2025-12-10

I fell down the vector database rabbit hole 😁

This year Storyblok announced Strata, our vector-powered platform to make content genuinely usable in the AI era (LLM search, RAG, ...). So my DevRel brain (the Senior part of it) said: ok, learn this properly, and share the journey with a 3-part series on our dev blog!

Part 1 is live: a gentle intro to the what/why behind vector DBs, with plenty of links for deeper dives. It's the "a‑ha!" moment I wish I had on day zero.

If you're new to this or want a clean mental model, give it a read, and please tell me what's missing so Part 2 (hands‑on, code + retrieval) can be even better!

PS: these are my findings as I go, no "professor" vibes here, I'm learning out loud so don't expect perfection (yet). If you spot gaps or have resources, drop them in! Let's learn this properly together 😉

#vectordatabases #LLM #RAG #devrel

storyblok.com/mp/what-s-the-bi

2025-12-10

Как спроектировать AI ассистента для поддержки и не слить бюджет. Часть 1: От идеи до выбора архитектуры

Каждая команда сейчас хочет заменить людей на AI. Но есть другой подход - усилить текущие возможности с помощью AI. Это может быть крутым драйвером для масштабирования и роста, а не поводом для увольнения. Покажу как спроектировать агента который решает проблемы и можно внедрять в продакшен. Буду рассказывать на примере юридической поддержки, но подход универсальный. Поговорим про RAG и GraphRAG, про развёртывание и выбор модели. Статья будет полезна как для больших компаний так и для маленьких - разница только в том где вы будете хранить и обрабатывать данные с LLM.

habr.com/ru/articles/975230/

#RAG #graphrag #ai #llmагент #ииассистент #автоматизация_поддержки

Christof Schöchchristof@fedihum.org
2025-12-10

@jomla @awinkler

Mein Eindruck ist auch, dass #LOD / Wissensgraphen weiterhin wichtig sind im #GLAM / Cultural Heritage / Digital Humanities-Bereich. Gibt ja auch Dinge wie #Graph-#RAG, die solche Ressourcen nutzen. Und auch die #NFDI-Konsortien #4Culture und #4Memory setzen auf LOD. Wird halt nur derzeit stark von der #LLM / #genAI Diskussion überlagert.

2025-12-10

Phân tích hệ thống bộ nhớ ChatGPT, phát hiện không dùng RAG. Kết luận: ChatGPT chưa vận dụng Retrieval-Augmented Generation (#RAG), tiết lộ cơ chế hoạt động khác. #ChatGPT #AI #TríTuệNhânTạo #NghiênCứuAI

reddit.com/r/programming/comme

2025-12-09

Local to ? The next Edinburgh Meetup is this Thursday, December 11 and you'll be able to catch @vyruss delivering "RAGTime with Postgres: AI Power with pgvector and Retrieval-Augmented Generation".

It's bound to be a great deal of fun - register here if you'd like to attend: luma.com/b9kv5fds

Too far to join, but still want to learn about the topic? Let us know 💬

2025-12-09

Создание корпоративной Базы Знаний для внедрения ИИ-инструментов

В статье описываю практический опыт построения корпоративного ИИ‑ассистента: от структуры базы знаний и графовой модели до фильтрации контекста и контроля версий. Материал будет полезен продактам, архитекторам, маркетологам и всем, кто внедряет ИИ в бизнес‑процессы. «Garbage in — garbage out», как мусор в корпоративной Базе Знаний мешает корректной работе ИИ и как мы предлагаем это исправить. Сегодня многие компании внедряют ИИ‑агентов по упрощённому сценарию: загружают PDF‑регламенты, Excel‑прайсы и архивы переписок в векторную БД, после чего ожидают, что модель будет корректно отвечать на вопросы пользователей. Такой подход, известный как Naive RAG , в большинстве случаев приводит к нестабильным результатам: несогласованные ответы, ошибки в тарифах, применение устаревших инструкций. Причина — не в возможностях моделей: современные LLM хорошо работают с контекстом. Проблема — в структуре данных , которые подаются на вход. Если знания представлены в виде фрагментов без связей, версий и семантической целостности, то на выходе появляется то, что обычно называют «галлюцинациями».

habr.com/ru/articles/974992/

#LLM #RAG #База_знаний #Внедрение_ИИ #Автоматизация_Бизнес_процессов #Чатботы #цифровизация_бизнеспроцессов #knowledge_management #knowledge_bases #искусственный_интеллект

2025-12-09

26조 원 AI 검색 스타트업 Perplexity, 뉴욕타임스에 제소당하다

26조 원 가치 AI 검색 스타트업 Perplexity가 뉴욕타임스에 제소당했습니다. 페이월 콘텐츠를 실시간으로 가져오는 RAG 기술이 쟁점입니다.

aisparkup.com/posts/7270

2025-12-09

RAG retrieval ko hỏng? Đa phần vấn đề nằm ở xử lý dữ liệu. Nhiều người dành cả tuần chỉnh tối ưu mô hình/truy xuất nhưng bỏ qua lỗi từ bước tiền xử lý: dữ liệu được cắt tách, bảng chia đôi, text nhiễu, meta thông tin bị xóa. Kiểm tra 50 đoạn dữ liệu ngẫu nhiên & so sánh file PDF gốc vs kết quả parser để khắc phục. #RAG #AI #MachineLearning #XuLyDuLieu #AIEngineering

reddit.com/r/LocalLLaMA/commen

Erik JonkerErikJonker
2025-12-08

If you want to spend time on AI you can best spend it on lectures like this. No hype, just science, but in this case also very practical.
youtu.be/k1njvbBmfsw?si=yWJPqm

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst