Một thử nghiệm đối chiếu Gemini 2.5 Flash & các mô hình mã nguồn mở (OSS) trong tạo giao diện UI thông qua prompt chi tiết 62.9k token. Gemnini hoàn thành mượt mà, các mô hình OSS như Qwen, GPT-OSS, Llama-70B… phần lớn gặp lỗi: tắc nghẽn trong reasoning (dù đặt "low"), gọi tool sai, hoặc bỏ qua quy trình. Chỉ Kwaipilot-kat-coder thực hiện được nhưng chậm 3x & lỗi gọi tool. Cơ bản là kiến trúc khác biệt hay lỗi triển khai?
#AI #MôHìnhĐạiDiện #Gemini #MãNguồnMở #LậpTrình #TestingAI #TốiTânAI #G
