Sử dụng iGPU + dGPU để giảm tải CPU khi chạy inference: tải CPU giảm mạnh từ 33–47% xuống chỉ 1–6%, hệ thống im lặng, nhưng tốc độ xử lý giảm đáng kể (25.7 tok/s → 6.7 tok/s). Phù hợp với tác vụ dài, không yêu cầu tương tác tức thời. #iGPU #dGPU #CPUload #inference #AI #ollama #LaptopAI #HiệuSuất #TốiƯuHóa
https://www.reddit.com/r/ollama/comments/1q1ictw/igpu_dgpu_for_reducing_cpu_load/











