Bộ dữ liệu Hugging Face mới (17-23/1/2026): LightOnOCR-mix-0126 cho OCR hiệu suất cao, lunara-aesthetic đánh giá hình ảnh thẩm mỹ, ChartVerse-SFT cho nhận diện biểu đồ, pubmed-ocr cho tài liệu khoa học. OmniScience: dữ liệu đa phương thức từ báo khoa học; 10Kh-RealOmin-OpenData cho robot học; PhysicalAI cho xe tự hành. RubricHub_v1 đánh giá LLM, LongPage tóm tắt văn bản dài. FOMO300K: 318k ảnh MRI não. #HuggingFace #Dataset #AI #MachineLearning #OCR #Robotics #MedicalAI #VLM #Vietnamese
https:/



