Bài viết mới: LOGOS-ZERO - Đổi mới tiếp cận Alignment bằng Nhiệt động học. Thay RLHF truyền thống, bài nghiên cứu đưa ra hàm loss vật lý khiến "ảo tưởng và mâu thuẫn" trở nên tốn năng lượng cho AI trong suy luận. Chỉ ra lỗi L.A.D. khi độ phức tạp ghi đè an toàn hiện tại. Cần góp ý về áp dụng phạt entropy. #AI #Alignment #LOGOSZERO #NhiệtĐộngHọc #MáyHọc
https://www.reddit.com/r/LocalLLaMA/comments/1ppurlz/paper_a_thermodynamic_approach_to_alignment/