#Qdrant

2026-02-01

Đã triển khai bộ nhớ ngữ nghĩa bền vững cho trợ lý AI trên Raspberry Pi 5 – dùng Qdrant + MCP, không cần đám mây, truy vấn ~3 giây. Toàn bộ xử lý cục bộ: Pi 5 (8GB), OpenClaw, mô hình embedding all-MiniLM-L6-v2 (ONNX), mcporter kết nối Qdrant local. Giải quyết vấn đề quên thông tin, mâu thuẫn dữ liệu. Hiệu năng ổn: 3s cho lưu/tìm kiếm, RAM tăng tạm ~200MB. Lưu trữ bằng SQLite, nhẹ và hiệu quả. #AI #RaspberryPi #SelfHosted #LocalAI #Qdrant #MCP #TríTuệNhânTạo #TựĐộngHóa #MáyTínhNhúng

https://www

2026-01-27

Tự lưu trữ trình đại lý RAG với ~10k e-book trên VPS Hetzner. Liệu tôi đang yêu cầu rắc rối? Sử dụng CPU 4 lõi, 8GB RAM, vector DB Qdrant. #RAG #SelfHosting #Hetzner #LLM #TựLưuTrữ #TrìnhĐạiLý #Ebook #VectorDB #Qdrant #CPU #RAM

reddit.com/r/selfhosted/commen

2026-01-22

Hướng dẫn chi tiết triển khai RAG (Retrieval Augmented Generation) trên laptop bằng n8n, Ollama và Qdrant (Docker). Bao gồm nhiều screenshot hướng dẫn cấu hình từng thành phần. #Ollama #n8n #Qdrant #dataSovereignty #embeddedAI #tríTuệNhânTạo #dữLiệuSởSở

reddit.com/r/ollama/comments/1

2026-01-11

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

После 10 лет внедрения BI-систем (Qlik Sense, Power BI, Data Lens) я понял одну вещь: дашборд — это не решение. Это данные для решения. А между данными и решением — пропасть, которую преодолевает человек. В этой статье покажу, как построил RAG-систему с чат-интерфейсом для базы из 600 000 записей техники из Федресурса. Без философии — только архитектура, код и грабли.

habr.com/ru/articles/984162/

#RAG #LLM #texttoSQL #Claude_API #Qdrant #PostgreSQL #чатбот #embeddings #NLP #FastAPI

2026-01-10

AI & RAG. Помощник по техническим вопросам систем управления освещением

Свою первую программу я написал в 1988 году на калькуляторе МК52. Очень хотелось программировать и даже максимально странный интерфейс не останавливал. Утекло почти 40 лет. Были Атари, Синклеры, 286 IBM, Интернет, смартофоны. Но все эти технологии входили как-то постепенно, приспосабливаясь и без шока. AI ворвался в жизнь бывалого ИТшника как пыльным мешком по голове. После первого шока, скормленных Дипсику результатов анализов, идей подарков, профессиональная “чуйка” потребовала придумать новой чудо-технологии боевое применение в том, чем я занимаюсь каждый день на протяжении всей сознательной жизни. Фокус группы не сформулировали внятного предложения куда погрузить AI - было решен что потрачу время и часы штатных программистов на то, чтобы уменьшить свою боль - держать в голове кучу технических нюансов, документации, кейсов и лайвхаков.

habr.com/ru/articles/983974/

#RAG #Qdrant #FRIDA #эмбеддинг #Qwen #локальная_LLM #техническая_документация #Claude #системы_управления_освещением #AIfirst

2026-01-02

Базовый RAG-компонент для локального семантического поиска на Питоне

quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как плагин для MCP (Model Context Protocol), но стал универсальной основой для любой системы локального семантического поиска. Зачем это нужно В процессе работы с кодовой базой через LLM-агентов и при необходимости локального семантического поиска по файлам проекта обнаружилась проблема. Инструменты агентской разработки вроде Kilo Code предоставляют встроенную функцию семантического поиска, но в компании заявляют что в будущем эта функциональность может стать платной. Сразу задумался о том чтобы сделать свою подсистему поиска. Простые запросы к MCP-серверу на поиск и обновление тут не подойдут - система поиска должна иметь полный контроль над контекстом - она должна автоматически узнавать, что файл удалён, функция изменена или добавлен новый документ, без необходимости перезапуска индексации. От идеи к архитектуре В начале планировался простой MCP-сервер, который принимает команды поиска и обновления, индексирует текстовые файлы и PDF, использует Qdrant как векторное хранилище и эмбеддит локально. В ходе проектирования стало понятно: вся логика отслеживания файлов, парсинга, чанкинга и синхронизации с Qdrant — это переиспользуемое ядро, а не часть MCP-протокола. Так появился quad_rag_core — отдельный Python-модуль, который не знает ничего про MCP или другие внешние интерфейсы, но готов к ним подключаться.

habr.com/ru/articles/982476/

#rag #rag_ai #семантический_поиск #middleware #python #qdrant #embeddings

2025-12-28

Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков

Как сделать свой аналог Pinterest, если у вас нет бюджета корпорации, но есть 4 ТБ картинок (17 миллионов штук) и желание искать по ним не просто по тегам, а по визуальному стилю? В статье — опыт построения распределенной системы поиска из подручных средств. Разбираем архитектуру: — Гибридное хранение: Backblaze B2 (холодное) + Домашний сервер (вычисления). — Сеть: Как ZeroTier объединил разрозненные ноды в одну Mesh-сеть без белых IP. — Векторный поиск: Как уместить 17 миллионов векторов OpenCLIP ViT-H/14 в 32 ГБ RAM с помощью Qdrant и квантизации. — Оптимизация: Почему поиск работает за 5 мс, а загрузка метаданных тормозила до 3 секунд, и как PostgreSQL спас ситуацию. Полный разбор ETL-пайплайна и экономики домашнего HighLoad-проекта.

habr.com/ru/articles/981330/

#python #векторные_базы_данных #qdrant #поиск_изображений #clip #zerotier #оптимизация #petproject #diy #selfhosting

2025-12-22

Как и зачем мы разработали систему анализа аномальных логов. Кейс MWS

Привет, Хабр! Меня зовут Андрей Басов, я руководитель команды технической поддержки стрима корпоративных продуктов и сервисов в MWS. Вместе со своими коллегами — Тимуром Хабибулиным (data scientist) и Рафисом Ганеевым (senior devops engineer) — занимаюсь технической поддержкой и сопровождением продуктов линейки Partner Experience Platform. Чтобы улучшить качество наших сервисов, через которые МТС взаимодействует с партнерами, мы вынуждены постоянно внедрять новые решения, растить продукты и развивать их архитектуру, при этом нам важно обеспечивать надежность и стабильность работы ИТ-систем. Это не всегда дается легко, ведь объемы данных растут, и их нужно эффективно обрабатывать. Одной из основных проблем становится анализ логов — текстовых записей. В нашем случае они фиксируют события в работе систем, которые созданы за 25+ лет работы компании, а еще у них различные стеки и архитектурные подходы. Объемы данных настолько велики, что проанализировать вручную (например, в OpenSearch/Kibana) даже один продукт практически невозможно, иначе нам пришлось бы просматривать миллионы строк логов каждый день. Поэтому мы решили разработать систему, которая позволила бы автоматически выявлять в логах аномалии — события, не свойственные нормальному функционированию системы. Например, это могут быть следы багов, вызванных новыми релизами, или другие непредвиденные происшествия. Что из этого вышло — расскажу дальше.

habr.com/ru/companies/ru_mts/a

#машинное_обучение #qdrant #observability #python #mws #Векторный_поиск #Кластеризация #HDBSCAN #bgem3 #микросервисы

Scott Gallowayscottgal@hachyderm.io
2025-12-16

Ok as that Syncfusion on a TERRIBLE approach to word document summarization (expensive, doesn't scale etc..etc...) so offended me here's how to do it better, for free, locally.

mostlylucid.net/blog/building-
(blame @alvinashcraft for posting the syncfusion thing on LinkedIn for raising my ire 😜)
#llm #rag #qdrant #csharp

2025-12-14

In Episode 3 of Automation for Business I show how RAG & vector databases power:

🧠 AI Knowledge Assistant
🛒 SalesBots
👤 Facial recognition
📚 Visual product matching (search by image)

Full video👇
youtu.be/erCuNXkdEAQ

SalesBot Responding in Telegram Using Hybrid Vector Search, Supporting Both Text and Voice QueriesMore Examples of SalesBot Queries - Understanding Topics, Price Filters, and Context SwitchingFacial Recognition in Action - Upload a Photo and Receive the Closest Match Returned from the Vector DatabaseMore Facial Recognition Example - Uploaded Photos and Their Closest Matches
2025-12-08

Векторный поиск: как выбрать систему и не пожалеть

От поиска по архивам документов и медиафайлам до рекомендательных систем и AI приложений — всюду работают эмбеддинги и векторный поиск. Но когда дело доходит до выбора конкретного инструмента, глаза разбегаются: Qdrant, Milvus, Weaviate, Redis, Elasticsearch, Pgvector… Если вы: - планируете внедрять семантический поиск в свой продукт, - выбираете между проверенными временем БД и специализированными системами обработки векторов, - ищете независисые бенчмарки, то этот материал — для вас. Мы разберем основные концепции векторного поиска, сравним популярные open-source решения и протестируем скорость их работы с учетом загрузки процессора и памяти.

habr.com/ru/companies/tensor/a

#векторный_поиск #pgvector #pgvectors #milvus #weaviate #redis #qdrant #vespa #elasticsearch #chroma

2025-11-11

Một repo GitHub mới về Agentic RAG dành cho người mới bắt đầu đã ra mắt! Cung cấp hướng dẫn toàn diện từ chuyển đổi PDF, phân đoạn phân cấp, nhúng lai, lưu trữ vector với Qdrant, xử lý truy vấn đa luồng, đến agentic RAG hoàn chỉnh dùng LangGraph và chatbot Gradio. Hữu ích cho ai muốn tìm hiểu sâu về RAG và agent.

#AgenticRAG #LLM #AI #Developers #GitHub #RAG #LangGraph #Qdrant
#AgenticRAG #LLM #AI #LậpTrìnhViên #GitHub #RAG #LangGraph #Qdrant

reddit.com/r/LocalLLaMA/commen

2025-10-31

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода/SQL и англоязычной терминологии. Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки:

habr.com/ru/articles/961972/

#rag #ai #embeddings #qdrant #large_language_model

2025-10-29

Dự án cài đặt AI cục bộ cho chatbot: Bạn cần kinh phí 5-10.000 EUR để chọn cấu hình phần cứng tối ưu? 13 client, 20-30 cuộc trò chuyện đồng thời, yêu cầu GPU mạnh. Nên chọn RTX 3090, L40S, A6000 hay 4090? #AILocal #Chatbot #Tech #HệThốngAI #GPU #LocalAI #MáyTínhCaoCấp #Qdrant #AIHardware #ThảoLuậnCôngNghệ #VietnamAI

reddit.com/r/LocalLLaMA/commen

2025-10-29

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB, pgvector, Redis, pgvectorscale, LanceDB, ClickHouse, Vespa, Marqo, ElasticSearch. Если вы запутались в разнообразии векторных баз данных или хочется верхнеуровнево понимать как они устроены, чем отличаются и для чего вообще нужны, то эта статья будет очень полезна. Мы пошагово соберем все ожидания от векторных БД, посмотрим бенчмарки, а затем попробуем собрать все воедино.

habr.com/ru/articles/961088/

#базы_данных #milvus #pgvector #qdrant #redis #chroma #chromadb #ииагенты #aiагенты #LLM

Today I build my first purely local AI based on RAG using open source tools Ollama, Qdrant and .NET. Harder than expected, but satisfying when it finally worked. #opensource #ai #ollama #qdrant #llm

2025-10-16

Как я добавил систему рекомендаций контента в легаси-проект на PHP 7.2

Привет, хабр! Хочу поделиться историей о том, как столкнулся с проблемой, возможно знакомой многим разработчикам: необходимость внедрить систему рекомендаций в проект, который все еще работает на старой версии php. Обновление версии php в legacy-проекте — это часто настоящий квест. То времени нет, то бизнес-фичи надо пилить, то еще какие-то причины. И часто бывает, что обновление версии php в командах откладывается на потом.

habr.com/ru/articles/957224/

#qdrant #ollama #php #векторный_поиск #рекомендательная_система #рекомендательные_системы #библиотека

2025-09-23

🚀 #InfinitoNexus erreicht volle AI-Souveränität!
Mit Open WebUI & Flowise lassen sich Unternehmensdaten aus Cloud, Kalender, Wikis, E-Mail & Co. automatisch in eigene KI-Workflows einbinden – sicher, #DSGVO-konform & ohne die Infrastruktur zu verlassen.

👉 Mehr erfahren: s.infinito.nexus/aisouveraenit

#AISouveränität #DigitaleSouveränität #Datensouveränität #AI #KI #OpenSource #SelfHosting #OnPremises #CloudAct #Privacy #DataSovereignty #OpenWebUI #Flowise #Ollama #LiteLLM #Qdrant #LLM #SovereignCloud

2025-09-23

Volle AI-Souveränität mit Infinito.Nexus

Mit Stolz können wir verkünden: Infinito.Nexus erreicht nun volle Souveränität im Bereich Künstliche Intelligenz. Durch die Integration von Open WebUI und Flowise bieten wir leistungsstarke Werkzeuge, mit denen Unternehmen ihre eigenen Daten sicher, lokal und DSGVO-konform in KI-Workflows einbinden können – ohne dass vertrauliche Informationen jemals die eigenen Server verlassen. […]

blog.infinito.nexus/blog/2025/

Eine allegorische Illustration im Stil der Französischen Revolution: Fröhliche Biber stürmen mit Ethernet-Kabeln und Fahnen eine düstere Bastille, die ein Gesicht trägt und die Künstliche Intelligenz symbolisiert. Auf den Fahnen sind die EU-Flagge, die deutsche und die französische Nationalflagge sowie das Infinito.Nexus-Logo zu sehen. Über der Bastille weht eine US-Flagge. Die Szene vermittelt den Kampf um digitale Souveränität, dargestellt durch freundliche, entschlossene Biber, die gemeinsam gegen eine bedrohlich wirkende Cyber-Bastille marschieren.

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst