Design Arena (@Designarena)
BREAKING: Qwen3.5 397B A17B와 Qwen3.5 Plus 02-15가 Design Arena 벤치마크에서 각각 전체 14위·20위를 기록했다고 발표했습니다. 이들은 GLM-4.7 Flash 및 Claude 3.7 Sonnet과 동일한 성능 밴드에 속하며, Alibaba_Qwen 팀의 성과를 축하하고 있습니다.
Design Arena (@Designarena)
BREAKING: Qwen3.5 397B A17B와 Qwen3.5 Plus 02-15가 Design Arena 벤치마크에서 각각 전체 14위·20위를 기록했다고 발표했습니다. 이들은 GLM-4.7 Flash 및 Claude 3.7 Sonnet과 동일한 성능 밴드에 속하며, Alibaba_Qwen 팀의 성과를 축하하고 있습니다.
Design Arena (@Designarena)
GLM-5가 Design Arena에서 전체 3위를 기록했으며, 오픈 웨이트 모델 중에서는 다시 1위를 되찾았다는 소식입니다. 또한 Design Arena 상위 10위 중 오픈 웨이트 모델이 50%를 차지하게 되었고, 이 성과를 이룬 Zai_org 팀에 대한 축하 메시지를 전하고 있습니다.
Design Arena (@Designarena)
Mobile Arena를 소개하는 공지로, '실제 모바일 앱 코딩 벤치마크'라는 점을 강조합니다. Design Arena에서 모바일 앱을 만들고 바로 휴대폰에서 열어볼 수 있으며, 초기에는 Anthropic, OpenAI, Google, xAI, Zai_org, Kimi_Moonshot, deepseek_ai 등 주요 모델/조직을 시작점으로 삼는다고 밝혔습니다. 개발자용 벤치마크·워크플로우 발표입니다.
Design Arena (@Designarena)
Claude Opus 4.6과 그 'thinking' 변형이 Design Arena에서 각각 1위와 2위를 차지했습니다. 이로써 상위 5개 모델 중 3개가 Anthropic 소속임이 확인되었으며, Anthropic의 성과를 알리는 소식입니다.
Mô hình AesCoder 4B ra mắt là mô hình WebDev hàng đầu trên Design Arena #AesCoder #WebDev #DesignArena #MôHìnhTríTuệNhanTạo #TríTuệNhanTạo #ThiếtKếArena #CôngNghệ #Tech #Technology
https://www.reddit.com/r/LocalLLaMA/comments/1orwirm/aescoder_4b_debuts_as_the_top_webdev_model_on/
Mô hình tàng hình mới trên Design Arena cực mạnh. Tăng tốc độ và trải nghiệm thiết kế #StealthModel #DesignArena #AI #TríTuệNhânTạo #ThiếtKế #MôHìnhTàngHình
https://www.reddit.com/r/LocalLLaMA/comments/1ol8p88/powerful_new_stealth_models_on_design_arena/
Mô hình AI "ẩn mình" Zenith Alpha mới xuất hiện trên Design Arena, dẫn đầu bảng xếp hạng với hiệu suất ấn tượng, đặc biệt ở animation tinh tế. Vị trí thứ 2: Claude Opus 4; thứ 3: Qwen3 235B Thinking. Bạn đoán đây là mô hình gì? #AIModel #ZenithAlpha #DesignArena #MôHìnhAI #TríTuệNhânTạo
https://www.reddit.com/r/LocalLLaMA/comments/1niz8cg/new_stealth_model_zenith_alpha_on_design_arena/
Crowdsourcing the best #AI for design? 🤔 More like watching a beauty pageant for overconfident robots competing in the "Who Can Make the Most Useless Widget the Fastest?" contest. 🙄 DesignArena: the ultimate exercise in finding out which AI can fail the Turing Test the fastest. 🎨🤖
https://www.designarena.ai/ #Crowdsourcing #Design #DesignArena #UselessWidgets #TuringTest #OverconfidentRobots #HackerNews #ngated
DesignArena – crowdsourced benchmark for AI-generated UI/UX