BabyVision Benchmark offenbart massive Lücken in SOTA-Modellen. Während Menschen 94% bei räumlichen Tests für Kleinkinder erreichen, scheitern GPT-5 und Gemini bei unter 50%. Ursache ist die interne Übersetzung visueller Inputs in Text ohne echtes physikalisches Verständnis. Für sicherheitskritische Robotik-Anwendungen ist dieser Ansatz aktuell ungeeignet. #BabyVision #GPT5 #Gemini
https://www.all-ai.de/news/news26/babyvision-benchmark-ki