#Milvus

2025-12-31

Автоматизация подготовки датасета для задачи сегментации объектов: от сбора данных до готового прототипа за пару дней

Проблема Представьте ситуацию: у вас задача: нужно сделать прототип проекта, который требует обучения модели сегментации на специфичных данных. Классический подход — это недели и даже месяцы ручной работы: • Сбор и запись данных • Удаление дубликатов вручную • Ручная разметка тысяч изображений (Это и деньги, и время) • Валидация качества данных (Это тоже и деньги, и время) • Подготовка датасета для обучения Для маленькой команды, стартапа, это ну прям А что если весь этот процесс можно автоматизировать и сократить с недель до нескольких минут? Именно такую систему мы разработали буквально за один день для нового прототипного проекта.

habr.com/ru/articles/982112/

#SAM3 #YOLO #computervision #deeplearning #activelearning #cvat #embeddings #milvus

Avi Chawla (@_avichawla)

Binary Quantization을 활용해 3,600만개 이상의 벡터를 <30ms로 쿼리하는 RAG(검색 기반 생성) 시스템을 구성하는 방법을 공유합니다. 기술 스택: llama_index(오케스트레이션), Milvus(벡터 DB), Kimi-K2 LLM(호스팅: Groq). 고성능 벡터 검색·응답 파이프라인 사례입니다.

x.com/_avichawla/status/200407

#rag #vectordb #binaryquantization #milvus #llm

GripNewsGripNews
2025-12-16

🌘 七年、兩次重大重塑、逾四萬 GitHub 星標:Milvus 如何躍升為領先開源向量資料庫
➤ 開源向量資料庫 Milvus 的崛起之路與關鍵進化
milvus.io/blog/milvus-exceeds-
Milvus,一款開源向量資料庫,從 2017 年起便致力於為 AI 應用提供高效、可擴展且可靠的數據基礎設施。歷經兩次重大架構重塑,Milvus 不斷進化,從最初的概念驗證到如今成為企業級 AI 工作負載的關鍵支撐。透過開源社羣的貢獻與反饋,Milvus 逐步完善,特別是 Milvus 2.5 和 2.6 版本,透過引入原生混合搜尋、優化儲存與記憶體使用、提升索引效能,顯著降低了成本並增強了效能。此外,Zilliz 也推出 DeepSearcher 和 Claude Context 等開源工具,進一步豐富 AI 開發者生態系,展現其對開放、透明 AI 基礎設施的承諾。
+ Milvus 的發展歷程真的很勵志,從一個小團隊的願景,到如今擁有龐大的社羣和商業應用,

2025-12-08

Векторный поиск: как выбрать систему и не пожалеть

От поиска по архивам документов и медиафайлам до рекомендательных систем и AI приложений — всюду работают эмбеддинги и векторный поиск. Но когда дело доходит до выбора конкретного инструмента, глаза разбегаются: Qdrant, Milvus, Weaviate, Redis, Elasticsearch, Pgvector… Если вы: - планируете внедрять семантический поиск в свой продукт, - выбираете между проверенными временем БД и специализированными системами обработки векторов, - ищете независисые бенчмарки, то этот материал — для вас. Мы разберем основные концепции векторного поиска, сравним популярные open-source решения и протестируем скорость их работы с учетом загрузки процессора и памяти.

habr.com/ru/companies/tensor/a

#векторный_поиск #pgvector #pgvectors #milvus #weaviate #redis #qdrant #vespa #elasticsearch #chroma

2025-11-30

Любовное письмо LLM, или как я перестал бояться и впервые довел пет-проект до конца

Я ненавижу пет-проекты. Да, я НЕНАВИЖУ их всей своей душой. Ровно с тех пор, как получил свою первую фул-тайм работу разработчиком. Я ненавижу приходить с работы и вставать перед выбором - работать в рамках привычного мне фронтенда, которым я занимаюсь на моей “с 9 до 5” и от которого к концу рабочей недели уже тошнит. …или с головой погружаться в новые технологии, медленно и мучительно прогрызаясь через них, прежде, чем у тебя получится сделать нечто чуть лучше условного Hello world. Если ты, конечно, не готов жертвовать сном, другими хобби или временем, проведенным с любимыми людьми. По крайней мере, я так думал до одного забавного дня пару месяцев назад.

habr.com/ru/articles/971742/

#python #milvus #telegram #telegrambot #петпроект

2025-10-29

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB, pgvector, Redis, pgvectorscale, LanceDB, ClickHouse, Vespa, Marqo, ElasticSearch. Если вы запутались в разнообразии векторных баз данных или хочется верхнеуровнево понимать как они устроены, чем отличаются и для чего вообще нужны, то эта статья будет очень полезна. Мы пошагово соберем все ожидания от векторных БД, посмотрим бенчмарки, а затем попробуем собрать все воедино.

habr.com/ru/articles/961088/

#базы_данных #milvus #pgvector #qdrant #redis #chroma #chromadb #ииагенты #aiагенты #LLM

2025-10-19

"Xây dựng pipeline tìm kiếm druge nhé! 🤔 Cảpgvector hayLLamaIndex+Milvus? Nhu cầu millions rows. Giúpôi về t_CSAL, skalabilité, bảo trì! #pgvector #LlamaIndex #Milvus #SemanticSearch #Python #AI"

reddit.com/r/LocalLLaMA/commen

2025-10-11
October #milvus-milvus
2025-09-09

Как мы научили LLM отвечать на вопросы абитуриентов в крупнейшем вузе страны

Академий показал, что LLM-бот может работать в продакшене, а не в демо. RAG, SQL-модуль, собственный бенч и GPU-инфра позволили выдержать десятки тысяч запросов в реальной приёмной кампании. Для абитуриентов это быстрые и точные ответы 24/7, для вуза — разгрузка комиссии и масштабируемый инструмент. Для нас — платформа, где мы улучшаем подходы к RAG, фильтрации и безопасности в живой среде.

habr.com/ru/articles/944500/

#llmбот #rag #qwen3 #vllm #milvus #langgraph #ранхигс

GripNewsGripNews
2025-09-08

🌘 Amazon S3 Vectors 會扼殺向量資料庫,還是拯救它們?
➤ S3 Vectors:向量搜尋成本殺手,抑或生態系新夥伴?
zilliz.com/blog/will-amazon-s3
本文探討 Amazon S3 Vectors 的出現對向量資料庫市場的影響。作者認為,S3 Vectors 雖然能大幅降低儲存成本並提供極致擴展性,尤其適合低查詢頻率且能容忍延遲的工作負載,但其效能限制和較高的查詢延遲,使其難以取代專業向量資料庫。相反地,S3 Vectors 更適合作為專業向量資料庫的補充,形成一種分層儲存的解決方案,結合兩者的優勢。
+ 這篇文章提供了非常有價值的見解。我一直擔心向量搜尋的成本問題,S3 Vectors 的出現確實讓人眼前一亮,但效能的取捨是關鍵。
+ 身為 Milvus 的使用者,我認為作者的觀點很有道理。S3 Vectors 聽起來很吸引人,但對於需要即時
S3

Masoud Masoumimasoudmim
2025-06-22

I decided to give it a try and write a simple RAG-based documentation-to-chatbot procedure as an example for reviewing the procedure and hopefully providing a quick and interesting way of learning RAG.

This post walks you through the development of a RAG system from developing a vector database to creating a simple application built on Ollama, Milvus, and Streamlit.

See the post here: masoudmim.github.io/blog/2025/


general procedure to use a text file given by the user and then developing a Streamlit RAG-application via Milvus and Ollama running locally.
2025-01-10

[Перевод] Улучшение RAG с помощью графов знаний

Генерация с дополненной выборкой (RAG) — это метод, который соединяет внешние источники данных для улучшения вывода больших языковых моделей (LLM) . Этот метод идеально подходит для LLM для доступа к частным или специфичным для предметной области данным и решения проблем, связанных с галлюцинациями . Поэтому RAG широко используется для поддержки многих приложений GenAI, таких как чат-боты AI и системы рекомендаций . Базовый RAG обычно объединяет векторную базу данных и LLM, где векторная база данных хранит и извлекает контекстную информацию для пользовательских запросов, а LLM генерирует ответы на основе извлеченного контекста. Этот подход хорошо работает во многих случаях, однако он испытывает трудности со сложными задачами, такими как многоадресное рассуждение или ответы на вопросы, требующие соединения разрозненных фрагментов информации. Например, вопрос « Какое имя было дано сыну человека, который победил узурпатора Аллектуса? »

habr.com/ru/articles/871700/

#GraphRAG #rag #llm #milvus #knowledge_graph

Waseemiamwaseem
2024-10-09

Has anyone optimized and used on ?

I am not concerned with the disk usage but I do want to make sure RAM usage and CPU usage is optimized.

Katherine Druckmankatherined@reality2.social
2024-09-26

New Open at Intel podcast is out! I had a fantastic chat with Stephen Batifol of #Zilliz about #Milvus and the power of vector databases, as well as the MLOps community and how projects like OPEA can help developers new to #AI/ML find their way. Check it out!

Subscribe to Open at Intel in your favorite podcast app or find it at openatintel.podbean.com/e/unde

#Podcast #NewEpisode #AI #OPEA

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst