#langfuse

:rss: Qiita - 人気の記事qiita@rss-mstdn.studiofreesia.com
2025-03-25
:rss: Qiita - 人気の記事qiita@rss-mstdn.studiofreesia.com
2025-03-22

[Amazon Bedrock]MastraとNext.jsで生成AIアプリケーション作ってCDKでデプロイしましょう
qiita.com/Syoitu/items/bfcc49e

#qiita #AWS #bedrock #langfuse #Mastra

:rss: Qiita - 人気の記事qiita@rss-mstdn.studiofreesia.com
2025-02-24
2025-01-20

Security-RAG или как сделать AI Security tool на коленке

LLM-ки и LLM-агенты продолжают наводить шум. Cтатьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents , квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях. Пока бизнес спешит внедрить очередного виртуального помощника, тот зачастую превращается в неумелого продавца, который не только мешает клиентам связаться со службой поддержки, но и... Удиви меня

habr.com/ru/articles/874820/

#llm #llmattack #llmприложения #ml #langchain #langfuse #chromadb #промптинъекции #искусственный_интеллект

2025-01-16

Контроль и порядок. Разворачиваем платформу учёта затравок для БЯМ

Все мы знаем, что Гит здорово облегчает жизнь разработчикам. Версионирование позволяет нам вернуться на шаг назад, если мы где-то жестко напортачили. А еще оно помогает отслеживать изменения, которые мы вносим в код. Весь код и история изменений хранятся на сервере, через который может работать команда разрабов. Одним словом, удобно. Под катом расскажу, как поднять платформу для учета и версионирования затравок Langfuse. (Обложка сгенерирована DALL-E от OpenAI)

habr.com/ru/articles/874164/

#затравка #промптинг #версионирование_промптов #промпт_деплоймент #git_для_промптов #langfuse #пситехлаб

2024-11-07

[Перевод] Оценка LLM: комплексные оценщики и фреймворки оценки

В этой статье подробно описываются сложные статистические и предметно-ориентированные оценщики, которые можно использовать для оценки производительности крупных языковых моделей. В ней также рассматриваются наиболее широко используемые фреймворки оценки LLM, которые помогут вам начать оценивать производительность модели.

habr.com/ru/articles/855644/

#llm #BLEU #ROUGE #METEOR #BERTScore #MoverScore #DeepEval #Giskard #promptfoo #LangFuse

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst