#AIbenchmark

The Internet is Cracktheinternetiscrack
2025-04-08

So… did Meta fudge the numbers on LLaMA 4’s benchmark tests? 🤔

2025-01-24

Die Grenzen von KI austesten

Reuters & die New York Times berichten über einen neuen Test: Humanity's Last Exam. Mit 3.000 Fragen aus über 100 Themengebieten werden hier die Grenzen moderner KI-Systeme ausgetestet. Thorben Jansen vom IPN war an der Entwicklung beteiligt.

🔗 Mehr: lastexam.ai

New York Times: reuters.com/technology/artific

Reuters: reuters.com/technology/artific

#AI #AIBenchmark #KI #HumanitysLastExam

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst