#Prometheus2

라떼군 이야기mrlatte_story
2025-06-11

프롬프트, 이제는 LLM이 평가한다

프롬프트 품질, 이제는 감이 아니라 데이터로 판단합니다.
Prometheus 2와 GPT-4.1을 활용해 LLM이 다른 LLM 응답을 평가하는 'LLM-as-a-Judge' 실전 사례를 인포그랩이 공유합니다.

프롬프트 최적화는 이제 자동화되는 영역입니다. 더 이상 사람의 감각에 의존할 수 없습니다.

.1
news.mrlatte.net/posts/2025/06

2024-06-10

🧠 #Prometheus2 è un #LLM open source dedicato alla valutazione delle risposte dei sistemi #RAG
💡 L'uso di un modello come "giudice" è un approccio comune, ma con problemi come la trasparenza, la controllabilità e il costo.
⚙️ Le caratteristiche di Prometheus2:
👉 È costruito su #Mistral 7B e #Mixtral 8x7B.
👉 Può dare valutazioni dirette, una classificazione a coppie, o con configurazioni di valutazione custom.

#AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst