【発売前レビュー】Difyで作る生成AIアプリ完全入門
https://qiita.com/minorun365/items/15527ec7ffe8804ce290?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
LangChainやBedrockも対応!Phoenixで構築するLLMトレース基盤(Langfuseとの比較あり)
https://qiita.com/moritalous/items/578e1825325a21e0f013?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
#qiita #bedrock #opentelemetry #langchain #langfuse #arize_phoenix
Security-RAG или как сделать AI Security tool на коленке
LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня
https://habr.com/ru/articles/874820/
#llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект
Контроль и порядок. Разворачиваем платформу учёта затравок для БЯМ
Все мы знаем, что Гит здорово облегчает жизнь разработчикам. Версионирование позволяет нам вернуться на шаг назад, если мы где-то жестко напортачили. А еще оно помогает отслеживать изменения, которые мы вносим в код. Весь код и история изменений хранятся на сервере, через который может работать команда разрабов. Одним словом, удобно. Под катом расскажу, как поднять платформу для учета и версионирования затравок Langfuse. (Обложка сгенерирована DALL-E от OpenAI)
https://habr.com/ru/articles/874164/
#затравка #промптинг #версионирование_промптов #промпт_деплоймент #git_для_промптов #langfuse #пситехлаб
[Перевод] Оценка LLM: комплексные оценщики и фреймворки оценки
В этой статье подробно описываются сложные статистические и предметно-ориентированные оценщики, которые можно использовать для оценки производительности крупных языковых моделей. В ней также рассматриваются наиболее широко используемые фреймворки оценки LLM, которые помогут вам начать оценивать производительность модели.
https://habr.com/ru/articles/855644/
#llm #BLEU #ROUGE #METEOR #BERTScore #MoverScore #DeepEval #Giskard #promptfoo #LangFuse
[書籍レビュー]俺たちと探究するLLMアプリケーションのオブザーバビリティ
https://qiita.com/MK_Tech/items/4f7dd716560b26699145?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
LLM監視の定番OSS、LangfuseをAWS App Runnerにデプロイしてみよう!
https://qiita.com/minorun365/items/9551634a67001cff4073?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items