🔍 Một thành viên đang muốn finetune phi4‑mini‑reasoning để giải các bài toán khó hơn (openmathreasoning, aime25). Đã thử 1800 mẫu và GRPO, dùng unsloth để học định dạng câu hỏi. Hỏi cộng đồng: nên tăng dữ liệu? dùng mô hình lớn hơn? thêm tool‑calling? Chia sẻ kinh nghiệm nhé! #AI #Finetuning #MachineLearning #Math #Phi4Mini #LocalLLaMA #TríTuệNhânTạo #HuấnLuyệnMôHình #Toán
https://www.reddit.com/r/LocalLLaMA/comments/1pzsemu/advice_for_finetuning_small_reasoning_model/
