Các nhà phát triển đã tạo ra PhaseGPT v4.1 - một hệ thống từ chối được gán nhãn giúp phân biệt giữa "Tôi không biết" và "Tôi không được phép". Hệ thống này giúp tăng sự minh bạch, tính toàn vẹn và trung thực cho các mô hình ngôn ngữ lớn. PhaseGPT v4.1 đạt độ chính xác 100% trên bộ thử nghiệm 18 mẫu. #AI #nlp #trithuc #an_toàn #mô_hình_ngôn_ngữ
https://www.reddit.com/r/LocalLLaMA/comments/1q6ykxt/we_trained_a_16class_typed_refusal_system_that/