Lmst

GraphRAG: 8 способов укротить расширенный контекст у LLM

В 22% случаев онкологи не могут назначить лечение из-за рисков, связанных с хроническими заболеваниями. Сегодня разбираем кейс, в котором ИИ помогает врачам решать сложнейшие когнитивные задачи, связанные с лечением различных видов рака. Рассказываем про методологию GraphRAG, разбираем, как устроены и работают решения из кейса и проводим сравнительный анализ всех способов решить эту сложнейшую задачу. Привет, Хабр! Это Андрей Носов, AI-архитектор из Raft. Я проектирую и создаю системы, которые должны стоять годами — сегодня речь пойдёт именно о них. В этой статье по мотивам моего доклада на

https://habr.com/ru/companies/oleg-bunin/articles/984340/

#rag #graphrag #llm #medtech #медицина #Machine_Learning #Оптимизация_производительности #хранилища #PostgreSQL #базы_данных

Avi Chawla (@_avichawla)

임베딩 스택이 모델을 바꿀 때마다 100% 재인덱싱을 강제한다는 문제 제기. 많은 팀이 이를 불가피하다고 여기며, 예를 들어 대형 임베딩 모델로 RAG 파이프라인을 구성해 프로덕션에 배포한 뒤 시간이 지나 트래픽·요구사항이 바뀌면 전체 재인덱싱 비용과 운영 부담이 크게 증가한다는 점을 지적하고 있음.

https://x.com/_avichawla/status/2018210296608022845

#embeddings #rag #reindexing #mlops

Wax: Động cơ bộ nhớ đơn file, thuần Swift cho AI trên thiết bị – không server, không DB. Tích hợp dữ liệu, embedding, index và WAL trong 1 file xác định. Tìm kiếm lai (lexical + vector + temporal), an toàn khi sập nguồn, hỗ trợ GPU trên Apple Silicon. Mở nguồn, phù hợp trợ lý AI, ứng dụng offline/riêng tư. #Wax #OnDeviceAI #Swift #RAG #AI #LocalLLM #TríTuệNhânTạo #AItrênThiếtBị #SwiftUI #MachineLearning

https://www.reddit.com/r/LocalLLaMA/comments/1qtdejw/i_built_a_swiftnative_singlefile_memory

Akshay (@akshay_pachaar)

AI 에이전트 구축에 대해 '블로그나 영상보다 코드 작성과 직접 구축'을 권하며, AI Agent, RAG, MCP, 컨텍스트 엔지니어링 관련 90개 이상 오픈소스 프로젝트를 공개했고 누적 약 27k+ 스타를 보유했다고 알립니다. 실전 중심의 오픈소스 기여를 강조하는 게시물입니다.

https://x.com/akshay_pachaar/status/2017938839457952126

#aiagents #opensource #rag #contextengineering

A practical Java tutorial on using Apache Camel and LangChain4j to build scalable LLM chat and RAG pipelines for real-world systems. https://hackernoon.com/llms-as-integration-endpoints-building-apache-camel-routes-with-langchain4j-chat #rag

Владелец построил бота WhatsApp с 24/7-поддержкой, используя n8n, OpenAI и Supabase, без платы за Meta/WhatsApp Business API. Основные функции: автоматическая связь с клиентами, интеграция с CRM, календарём и таблицами, RAG-система (достоверные данные, не выдумывает ответы). Выгода: 100% работа, сбоев и оплат на платформу нет. Проблемы: настройка памяти и предотвращение блокировок по скорости отправки. #AI #WhatsAppBot #n8n #RAG #AutoCRM

===Viết tắt====
Chủ dự án tạo bot WhatsApp 24/7 miễn

Đang phát triển hệ thống RAG (AI lấy dữ liệu), người dùng muốn bán sản phẩm do không đủ thời gian duy trì khi học tập nhưng chưa biết quyết định này có tốt. Mong nhận ý kiến từ cộng đồng. #SaaS #RAG #StartupSuggestions #AI #SảnPhẩmCôngNghệ

https://www.reddit.com/r/SaaS/comments/1qsz2f9/chatam_i_cooked/

Milestone unlocked 🚀

Built a custom Linux system with Buildroot + PREEMPT_RT on x86_64, fully functional and minimal, supported by a local AI assistant with RAG, trained on official docs: no hallucinations, only grounded answers.

Real-time Linux, reproducible builds, full control.

This one feels big.

#Buildroot #Linux #RealTimeLinux #PREEMPTRT #Embedded #OnPremAI #RAG #Minimalism

The Sycophancy Fallacy: Why You May be Worried About the Wrong Bias with Search aarontay.substack.com/p/the-sycophan… #AI #libraries #searcg #RAG

The Sycophancy Fallacy: Why Yo...

The Sycophancy Fallacy: Why You May be Worried About the Wrong Bias with Search https://aarontay.substack.com/p/the-sycophancy-fallacy-why-you-may #AI #libraries #searcg #RAG

"Vừa hoàn thành dự án legal tech ứng dụng kiến trúc RAG, xử lý ~20k trang luật Singapore/giây. Thiết kế giao diện kiểu Apple, backend có 3 lớp dự phòng, tích hợp 3 model AI để đảm bảo hoạt động liên tục. Đang học hỏi và mong nhận feedback từ cộng đồng! #LegalTech #RAG #SingaporeLaws #AI #TripleBackup #PhapLySo #TríTuệNhânTạo #HệThốngDựPhòng"

https://www.reddit.com/r/ollama/comments/1qsofft/built_an_legal_tech_with_rag/

🔧 Kỹ sư O&G cảnh báo RAG gây “Zombie Facts” – truy xuất thông tin cũ gây rủi ro pháp lý. Ví dụ luật Overtime FLSA: RAG chuẩn trả $844 (đã bị tòa hủy) trong khi thực tế $684. Giải pháp MemoryGate dùng “Surgical Trust Decay” giảm độ tin cũ, giữ audit trail, ngăn hallucination. AI không chỉ tìm kiếm, mà là bảo hiểm trách nhiệm. #AI #RAG #Compliance #LegalTech #TríTuệNhânTạo #PhápLý #OilandGas

https://www.reddit.com/r/SaaS/comments/1qsmw1w/im_the_og_engineer_who_hated_rag_hallucinations_i/

RAG "ảo giác" có thể gây tai họa trong Legal/HR/O&G. Tôi gọi đó là "Zombie Facts" – thông tin lỗi thời vẫn hiển thị dù đã bị bác bỏ. Thử nghiệm với quy định FLSA 2024: RAG thông thường trả về mức $844 (đã vô hiệu), trong khi MemoryGate áp dụng "Surgical Trust Decay" để ưu tiên thông tin hợp lệ ($684). Khác biệt: tránh kiện tụng và sa thải. Đây không chỉ là tìm kiếm – là bảo hiểm trách nhiệm pháp lý cho AI. #RAG #AICompliance #LegalTech #HRtech #OilAndGas #MemoryGate #TríTuệNhânTạo #TuânThủ #Công

RAG pipelines often skip crucial data like voltage limits because they slice documents poorly. A new approach—semantic chunking with layout parsing—keeps context intact, boosting document intelligence on Azure. See how this open‑source tweak can sharpen retrieval‑augmented generation for engineers and researchers. #RAG #SemanticChunking #DocumentIntelligence #AzureAI

🔗 https://aidailypost.com/news/rag-systems-miss-data-like-voltage-limits-semantic-chunking-proposed

Provenance research needs RAG infrastructures with a human-in-the-loop to ensure scalability, interpretability, and ethical sensitivity. This paper shows how RAG enables multilingual search in the Getty Provenance Index. arxiv.org/abs/2508.19093 #DigitalHumanities #ProvenanceResearch #RAG

Die Provenienzforschung braucht transparente RAG-Infrastrukturen mit Human-in-the-Loop, um Skalierung, Nachvollziehbarkeit und ethische Sensibilität zugleich zu sichern.
Ein neues Paper zeigt, wie Retrieval-Augmented Generation (RAG) natürliche, mehrsprachige Suchanfragen im Getty Provenance Index ermöglicht und damit Provenienzforschung deutlich effizienter und explorativer macht.
https://arxiv.org/abs/2508.19093
#DigitalHumanities #ProvenanceResearch #RAG

A flowchart illustrating the RAG workflow. It includes components like GPI Data Records, a Text Embedding Model, a FAISS Vector Store, a query input, relevant records, GPT-4 processing, and a user-friendly formatted output.

Tìm hiểu kiến trúc LLM cục bộ kết hợp **MSSQL** (dữ liệu cấu trúc) và **Vector DB** (dữ liệu phi cấu trúc) với giao diện ChatGPT! Hệ thống kết hợp **RAG pipeline** để xử lý truy vấn:
- **Tạo câu lệnh SQL từ ngôn ngữ tự nhiên** cho MSSQL
- **Tìm kiếm ngữ nghĩa** trên dữ liệu tài liệu, email, chính sách qua vector database (FAISS/Qdrant…).
Đồng thời quản lý quyền, dữ liệu an toàn trong nội mạng.

#AI #MSSQL #VectorDB #RAG #Chatbot #DữLiệuCấuTrúc #VectorEmbedding #HệThốngLLM #KiếnTrúcPhầnMề

[Перевод] Объяснение галлюцинаций LLM

Большие языковые модели, типа GPT, Claude, Gemini и другие ИИ-системы, поразили разработчиков своей способностью генерировать тексты, звучащие как человеческие. Однако, если вы когда-либо использовали ChatGPT или подобные инструменты, вероятно, они не раз уверенно говорили вам что-то совершенно неверное. Эти ошибки ИИ, часто называемые «галлюцинациями», варьируются от незначительных фактических ошибок до полных выдумок. Они могут быть забавными (например, ИИ изобретает вымышленный исторический факт) или представлять серьезную проблему (представьте, что ИИ-ассистент предлагает несуществующую функцию или чат-бот выдает медицинский совет, которого не существует). В этой статье мы рассмотрим, почему языковые модели галлюцинируют и, что более важно, как мы можем уменьшить эти галлюцинации. Мы будем использовать интуитивно понятные примеры и аналогии, чтобы все было доступно, а также предложим инструментарий бесплатных техник, которые помогут удержать результаты работы ИИ в рамках реальности.

https://habr.com/ru/companies/otus/articles/988076/

#галлюцинации #ai #галлюцинации_LLM #проверка_фактов #RAG #промптинжиниринг

#RAG

Client Info