#BabyVision

Andreas BeckerCaramba1
2026-01-19

BabyVision Benchmark offenbart massive Lücken in SOTA-Modellen. Während Menschen 94% bei räumlichen Tests für Kleinkinder erreichen, scheitern GPT-5 und Gemini bei unter 50%. Ursache ist die interne Übersetzung visueller Inputs in Text ohne echtes physikalisches Verständnis. Für sicherheitskritische Robotik-Anwendungen ist dieser Ansatz aktuell ungeeignet.
all-ai.de/news/news26/babyvisi

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst