#VQA

2025-05-16

[Перевод] Reasoning CV-модели OpenAI не смогли посчитать монеты

Новые мультимодальные модели OpenAI o3 и o4-mini позиционируются как "разумные". Однако качественное тестирование на практических задачах вроде подсчета объектов и распознавания текста выявило неожиданные пробелы в их производительности, в некоторых случаях уступающие даже не-reasoning моделям. Узнайте, какие именно тесты провалили новинки и где показали уверенный результат.

habr.com/ru/articles/909052/

#ai #computervision #multimodal_llm #openai #llm #testing #evaluation #VQA #ocr

GenAINews.coGenAINews_top
2024-07-30

Just read an interesting article about zero-shot VQA evaluation using LLMs on Docmatix! Do we still need fine-tuning for VQA systems? 🤔

huggingface.co/blog/zero-shot-

2023-12-15

Opening the Canadian sauvignon blanc 🍇🍁#canada #wine #ontario #VQA

2023-01-18

This is not really a paper, but rather a note that stresses that if one implements a #variationalprinciple like in #VQA for translationally invariant #Hamiltonians, one better obtains energy densities that scale better than a small constant.

scirate.com/arxiv/2301.06142

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst