Lmst

【登壇レポート】 JAWS-UG熊本で「今からでも間に合う！生成AI『RAG』再入門」と題して登壇しました！ #jawsug #jawsugkmmt
https://dev.classmethod.jp/articles/jawsug-kumamoto-20250614-aoyagi/

#dev_classmethod #JAWS_UG #Amazon_Bedrock #RAG #Retrieval_Augmented_Generation #生成AI #AWS

[Перевод] Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь , на вторую часть — здесь , третью часть — здесь ). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных. Поскольку без пояснительной бригады часть их информации оказалась для меня совершенной абракадаброй (напомню, я — переводчик, то бишь гуманитарий) , я не поленился пройтись по упомянутым авторами ссылочкам на исследования, взять оттуда схемки и картинки, и добавил их к этой части тоже. Надеюсь, с ними рассуждения и наблюдения авторов будут значительно прозрачнее. Поехали! Прочитать остальные буквы

https://habr.com/ru/articles/910162/

#языковые_модели #llm #llmмодели #llmприложения #llmагент #llmархитектура #rag #rag_pipeline #retrieval_augmented_generation #retrieval

日本語に強くローカルで動作！テキスト埋め込みモデルPLaMo-Embedding-1Bを試してみた
https://dev.classmethod.jp/articles/shuntaka-try-plamo-embedding-1b/

#dev_classmethod #生成AI #Retrieval_Augmented_Generation

วิธีตั้งค่าการจำกัด IP สำหรับ GenU
https://dev.classmethod.jp/articles/how-to-set-ip-restrictions-for-genu/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS

วิธีตั้งค่า Hostname ก่อน Deploy GenU
https://dev.classmethod.jp/articles/how-to-set-hostname-before-deploy-genu/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно "прокачивать" модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов. Глаза разбегаются, наступает паралич выбора, ладошки потеют. А что, если попробовать их все? Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик. Получилось настолько удачно, что я выиграл конкурс во всех номинациях. Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат.

https://habr.com/ru/articles/893356/

#RAG #Docling #векторный_поиск #retrieval_augmented_generation #question_answering #LLM #FAISS #GPT #ChatGPT #парсинг_PDF

Show HN: Open-Source DocumentAI with Ollama
https://rlama.dev/
#ycombinator #RLAMA #RAG #Retrieval_Augmented_Generation #Ollama #Document_QA

ลองติดตั้ง Generative AI Use Cases JP (ชื่อย่อ: GenU) แบบง่ายๆ
https://dev.classmethod.jp/articles/generative-ai-use-cases-jp-genu-installation-guide-th/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #Amazon_Bedrock #AI #AWS #Thai_Language

วิธีลบ Generative AI Use Cases JP (ชื่อย่อ: GenU)
https://dev.classmethod.jp/articles/generative-ai-use-cases-jp-genu-deletion-guide-th/

#dev_classmethod #Classmethod_Thailand #Retrieval_Augmented_Generation #AWS #AI #Thai_Language

วิธีเพิ่มและลบ User ใน User Management ของ Cognito ที่ตั้งค่าไว้สำหรับ GenU
https://dev.classmethod.jp/articles/genu-user-management-with-cognito-th/

#dev_classmethod #Classmethod_Thailand #Amazon_Cognito #Retrieval_Augmented_Generation #AWS #AI #Thai_Language

GenUのユーザー管理用に設定したCognitoでユーザー追加削除方法
https://dev.classmethod.jp/articles/genu-user-management-with-cognito/

#dev_classmethod #Retrieval_Augmented_Generation #AWS #Amazon_Cognito #Classmethod_Thailand #生成AI

Generative AI Use Cases JP (略称:GenU) のシンプルにインストールしてみた
https://dev.classmethod.jp/articles/generative-ai-use-cases-jp-genu-installation-guide/

#dev_classmethod #Retrieval_Augmented_Generation #AWS #Amazon_Bedrock #Classmethod_Thailand #生成AI

[Перевод] 10 примеров и вариантов использования RAG от реальных компаний. Со схемами и пояснениями

Приходилось ли вам когда-нибудь упрекать чат-бот с LLM — к примеру, ChatGPT или Claude — в устаревшей или неточной информации? Дело в том, что, формируя ответ, крупные языковые модели (LLM) опираются на наборы данных, на которых они были обучены. Однако, поскольку их основная задача — предсказывать текст, а не извлекать факты, на их точность нельзя полагаться во всех случаях. Кроме того, обучающие датасеты обычно ограничены общедоступными данными и в некоторых областях быстро теряют актуальность.

https://habr.com/ru/articles/886732/

#ai #artificial_intelligence #llm #rag #retrieval_augmented_generation #ии #искусственный_интеллект #кейсы

Как выбрать embedding модель без датасета и исторических данных

С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными? Выбор эмбеддинг-модели — это стратегически важное и долгосрочное решение, так как оно определяет качество поиска и производительность системы. Но этот выбор особенно сложно сделать на ранних этапах развития вашего проекта, когда данных для анализа ещё нет. При этом замена модели в будущем может оказаться дорогостоящей и ресурсозатратной. На первый взгляд, решение принять несложно — заходим на какой-нибудь популярный бенчмарк и берем модель с топа. Но успех на лидерборде не гарантирует аналогичных результатов в специфичных доменах, таких как финансы, медицина или e-com. Без собственного датасета или пользовательской истории выбор модели становится настоящей проблемой. В этой статье мы представим подходы к качественной оценке эмбеддинг-моделей, применимые даже при отсутствии данных, если вы работаете в специализированной предметной области. Мы рассмотрим несколько способов оценки поведения векторных представлений, которые помогут сделать информированный выбор с опорой на реалии вашего проекта.

https://habr.com/ru/articles/885196/

#embeddings #nlp #python #retrieval #ai #rag #retrieval_augmented_generation

«Гараж» как инкубатор инноваций и л̶о̶г̶о̶в̶о S̶k̶y̶n̶e̶t

Привет, Хабровчане! Меня зовут Андрей Беляев, и я занимаюсь расширением возможностей организаций, внедряя ИИ-помощников. Сегодня я расскажу, как наша R&D-лаборатория, «лампово» называемая «Гараж», исследовала потенциал больших языковых моделей, проверяла бизнес-гипотезы и технические решения и в итоге запустила процесс создания корпоративной экосистемы GenAI, а также технологической платформы в ее основе.

https://habr.com/ru/companies/reksoft/articles/867298/

#chatgpt #genai #rag #retrieval_augmented_generation #techradar #codellm #whisper #openai #localai #ollama

Generative AI Use Cases JPのユースケースビルダーを利用してみる
https://dev.classmethod.jp/articles/generative-ai-use-cases-jp-200-builder/

#dev_classmethod #AWS #RAG #Retrieval_Augmented_Generation #ChatGPT

Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией

Ученые часто вдохновляется нашими или животными биологическими структурами: CNN, MLP, Backprop, и для многих других исследований можно найти сходства в реальном мире. Недавно вышла статья, которая делает то же самое, но для RAG (Retrieval-Augmented Generation). В некотором роде, это недостающая современным LLM долгосрочная память. Это понятно, а причем тут неокортекст, гиппокамп и другие сложные слова? Давайте посмотрим.

https://habr.com/ru/articles/860426/

#llm #rag #retrieval_augmented_generation #retrieval #machinelearning #machine_learning #natural_language_processing #transformer #transformers

[Amazon Bedrock] RAG利用時の選択肢「Kendra」と「Bedrock Knowledge Bases」を比較する
https://dev.classmethod.jp/articles/comparing-kendra-and-bedrock-knowledge-bases-when-using-rag/

#dev_classmethod #Amazon_Bedrock #Amazon_Bedrock_Knowledge_Bases #Amazon_Kendra #RAG #Retrieval_Augmented_Generation #生成AI #AWS

[Перевод] Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В контексте разговоров о больших языковых моделях (LLM) все чаще возникает аббревиатура RAG – Retrieval-Augmented Generation, или если переводить на русский язык, то «поисковая дополненная генерация». В этом тексте попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.

https://habr.com/ru/articles/841428/

#rag #llm #nlp #искусственный_интеллект #ai #retrieval_augmented_generation

Интеграция LLM в корпоративные чат-боты: RAG-подход и эксперименты

Всем привет! На связи команда AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. В этой статье мы опишем наш опыт работы с большими языковыми моделями (LLM), их внедрение для обработки корпоративных данных, а также поделимся нашими результатами и выводами. Ещё мы расскажем о нашем подходе к использованию LLM, подробно остановимся на методе Retrieval Augmented Generation (RAG) и рассмотрим примеры использования чат-ботов на корпоративных порталах X5. Эта статья будет полезна разработчикам, которые интересуются внедрением LLM для работы с корпоративными данными. Она основана на нашем выступлении на митапе, но не ограничивается им, а, скорее, дополняет его.

https://habr.com/ru/companies/X5Tech/articles/834832/

#llm #rag #ai #чатбот #искусственный_интеллект #ии #ииассистент #python #retrieval #retrieval_augmented_generation

#Retrieval_Augmented_Generation

Client Info