#nlp

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-20
Johnny GraberJGraber
2025-06-20
2025-06-19

Останется ли это правдой завтра? Как проверка устойчивости фактов помогает LLM стать честнее и умнее

Привет, Хабр! Мы в команде «Вычислительная семантика» в AIRI сфокусированы на исследовании галлюцинаций и решении проблем доверительной генерации. Мы учимся находить галлюцинации и бороться с ними. Большие языковые модели (LLM) вроде GPT-4 стали незаменимыми помощниками в повседневной жизни — от генерации текстов до поддержки в кодинге и ответов на вопросы. Однако у них есть ахиллесова пята: они часто галлюцинируют. В этом посте мы разберем нашу последнюю работу Will It Still Be True Tomorrow? , посвященную тому, как на надёжность моделей влияет феномен неизменного вопроса (evergreen question) — то есть вопроса, ответ на который не зависит ни от времени, когда вы его задаёте, ни от места, вопроса про факт, который зафиксирован в истории и не меняется от обстоятельств. В рамках этой работы мы совместно с MWS AI собрали датасет изменяемых и неизменных вопросов EverGreenQA ( открытый доступ ) , обучили классификатор на базе многоязычного энкодера E5, и применили его для оценки собственных знаний модели. Наши результаты показывают, что большие языковые модели чаще всего правильно отвечают на неизменные вопросы, не прибегая к помощи RAG пайплайна. Теперь обо всем по порядку.

habr.com/ru/companies/mts_ai/a

#llm #evergreen_questions #rag #qa_systems #nlp

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-19
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18

»Companies are betting on AI to help lift productivity. Workers need to be part of the process« theconversation.com/companies- #AIagent #AI #ML #NLP #LLM #GenAI

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18

»Key Takeaways From Cisco Live 2025: Cisco’s Big Bets For Unified Security And AI« forrester.com/blogs/key-takeaw #AIagent #AI #ML #NLP #LLM #GenAI

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18

»Grok’s ‘white genocide’ responses show how generative AI can be weaponized« theconversation.com/groks-whit #AIagent #AI #ML #NLP #LLM #GenAI

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18

»AI helps tell snow leopards apart, improving population counts for these majestic mountain predators« theconversation.com/ai-helps-t #AIagent #AI #ML #NLP #LLM #GenAI

Sunrise Technologiessunrisetechnologies
2025-06-18

⚡AI Chatbots That Speak Fluent ROI!
Sunrise Technologies builds GPT-based, multilingual chatbots that cut costs, boost engagement (40%), and run 24/7. Seamless CRM/ERP integration included.

👉 zurl.co/pWhwp

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-18

»Why a US court allowed a dead man to deliver his own victim impact statement – via an AI avatar« theconversation.com/why-a-us-c #AIagent #AI #ML #NLP #LLM #GenAI

AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-17
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-17
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-17
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-17
AIagent.at 🤖 AI, GenAI, AGIai@defcon.social
2025-06-17
Lenin alevski 🕵️💻alevsk@infosec.exchange
2025-06-17

New Open-Source Tool Spotlight 🚨🚨🚨

Transform any URL into an LLM-ready input with `Reader`. Just prefix the URL with `r.jina.ai/` for clean, readable content extraction. Perfect for enhancing agents & RAG pipelines. #LLM #NLP

Need web search results for your LLM? Prepend queries with `s.jina.ai/` to fetch top results—content included. E.g., `s.jina.ai/your+query` brings knowledge directly to your model. #AItools #DataEngineering

Reader API now supports images! Captions are auto-generated for images missing alt tags, giving LLMs better context for reasoning and summarizing multimedia pages. #MachineLearning #AI

🔗 Project link on #GitHub 👉 github.com/jina-ai/reader

#Infosec #Cybersecurity #Software #Technology #News #CTF #Cybersecuritycareer #hacking #redteam #blueteam #purpleteam #tips #opensource #cloudsecurity

— ✨
🔐 P.S. Found this helpful? Tap Follow for more cybersecurity tips and insights! I share weekly content for professionals and people who want to get into cyber. Happy hacking 💻🏴‍☠️

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst