#M%C3%B4H%C3%ACnhAI

2025-12-05

Doradus vừa phát hành bản lượng tử hóa đầu tiên: MiroThinker-v1.0-30B-FP8 trên Hugging Face. Mô hình này phù hợp cho người dùng có 2 GPU (tối ưu với Blackwell) và đi kèm Dockerfiles VLLM. Một nỗ lực đáng chú ý trong tối ưu hóa LLM!

#AIModel #LLM #Quantization #HuggingFace #GPU #MiroThinker
#MôHìnhAI #LượngTửHóa #TốiƯuMôHình

reddit.com/r/LocalLLaMA/commen

2025-12-04

So sánh các mô hình AI mã nguồn mở Mistral 3, Kimi K2 và Qwen 3!
- Mistral 3: Mạnh mẽ cho doanh nghiệp và khả năng mở rộng.
- Kimi K2: Xuất sắc cho lập trình và các tác vụ tổng quát.
- Qwen 3: Tối ưu chi phí và hỗ trợ đa ngôn ngữ (chatbot, CSKH).
Tất cả đều là lựa chọn chất lượng cao!

#AI #OpenSourceAI #Mistral3 #KimiK2 #Qwen3 #MôHìnhAI #TríTuệNhânTạo

reddit.com/r/LocalLLaMA/commen

2025-12-03

ByteDance vừa ra mắt mô hình Seedream 4.5 mới với nhiều cải tiến vượt bậc! Phiên bản này thể hiện khả năng xử lý văn bản và chỉnh sửa đa ảnh ấn tượng, cùng độ bám sát prompt tốt hơn đáng kể so với v4.0. Kết quả cực kỳ ấn tượng!

#Seedream #AI #ByteDance #GenerativeAI #MôHìnhAI #CôngNghệMới

reddit.com/r/singularity/comme

2025-12-02

Mistral AI vừa chính thức giới thiệu mô hình mới nhất của họ: Mistral 3! Hãy cùng đón chờ những thông tin chi tiết và khả năng ấn tượng mà phiên bản này mang lại.
#Mistral3 #MistralAI #AI #ArtificialIntelligence #MôHìnhAI

reddit.com/r/singularity/comme

2025-12-01

Mô hình AI mới Trinity Mini GGUF từ Arcee AI đã được phát hành! Đây là mô hình MoE 26B với 3B tham số hoạt động, thuộc dòng Trinity chuyên cho doanh nghiệp. Được tối ưu cho khả năng suy luận, có sẵn định dạng GGUF cho nền tảng llama.cpp.
#AI #TrinityMini #GGUF #ArceeAI #LLM #MachineLearning
#TríTuệNhânTạo #MôHìnhAI #HọcMáy

reddit.com/r/LocalLLaMA/commen

2025-12-01

Chỉ số Mở AI (Artificial Analysis Openness Index) vừa được công bố, là thước đo mới về mức độ mở của các mô hình trí tuệ nhân tạo. Điều này giúp đánh giá rõ ràng hơn về khả năng tiếp cận và minh bạch của các mô hình AI.

#AI #OpennessIndex #ArtificialAnalysis #ModelOpenness
#TríTuệNhânTạo #MôHìnhAI #ChỉSốMở

reddit.com/r/LocalLLaMA/commen

2025-12-01

DeepSeek đã phát hành phiên bản AI mới V3.2 và V3.2 Speciale. Đây là một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo.
#DeepSeek #AI #ModelRelease #TríTuệNhânTạo #MôHìnhAI #PhátHànhMới

reddit.com/r/singularity/comme

2025-12-01

Tác giả chia sẻ về việc sử dụng các "module prompt" nhỏ tái sử dụng với các mô hình AI local như LLaMA, Mistral, Qwen, Hermes. 5 module hữu ích: Message Polisher, Notes → Structured Summary, Idea Expander, Template Starter, và Weekly Layout. Các module này giúp cải thiện đáng kể hiệu suất làm việc khi chuyển đổi giữa các mô hình.

#AI #LocalAI #PromptEngineering #ChatGPTAutomation #MôHìnhAI #LocalLLaMA #TựĐộngHóa #AIVietnam

reddit.com/r/LocalLLaMA/commen

2025-11-30

Mô hình ngữ cảnh dài có thực sự giải quyết 'attention dilution'? Có người cho rằng Gemini 1M context loại bỏ RAG/chia nhỏ tài liệu. Tuy nhiên, tác giả bài viết nghi ngờ, kinh nghiệm cho thấy hiệu suất giảm mạnh sau 100K-200K token. Điều này rất quan trọng với tài liệu pháp lý cần độ chính xác cao.

#AI #LLM #LongContext #AttentionDilution #RAG #Chunking #Gemini #TechNews #ArtificialIntelligence
#MôHìnhAI #NgữCảnhDài #XửLýNgônNgữ #CôngNghệ #TríTuệNhânTạo #HỏiĐáp

reddit.com/r/LocalLLa

2025-11-29

Các phiên bản Qwen3-Next-80B-A3B GGUF mới đã có sẵn! Bao gồm lượng tử hóa imatrix và IQ, cùng với tối ưu hóa MoE, mang lại hiệu suất tốt hơn cho các mô hình LLM cục bộ.
#Qwen3Next #GGUF #LLM #AI #Quantization
#MôHìnhAI #LượngTửHóa #TríTuệNhânTạo

reddit.com/r/LocalLLaMA/commen

2025-11-29

Kỹ sư đảo ngược Tibor Blaho phát hiện chuỗi hệ thống quảng cáo trong phiên bản beta mới nhất của ChatGPT Android. Điều này có thể là một lý do nữa để người dùng ưu tiên các mô hình AI chạy cục bộ thay vì dịch vụ đám mây.

#ChatGPT #AI #LocalModels #QuảngCáo #MôHìnhAI

reddit.com/r/LocalLLaMA/commen

2025-11-27

NanoChat đã chính thức được tích hợp vào thư viện Hugging Face Transformers! Bài viết chuyên sâu mới nhất đi sâu vào kiến trúc NanoChat, quy trình tích hợp và hướng dẫn sử dụng các công cụ như Torch, TRL, vLLM cho suy luận và huấn luyện. Khám phá ngay!

#NanoChat #Transformers #HuggingFace #AIVietnam #MôHìnhAI #HọcMáy #AI #MachineLearning #DeepLearning #LLM #NLP #TechNews

reddit.com/r/LocalLLaMA/commen

2025-11-27

Một người dùng đang thắc mắc về cách lệnh `/set nothink` của Ollama vô hiệu hóa hoặc kiểm soát khả năng suy luận của các mô hình, đặc biệt là các mô hình gpt-oss. Liệu nó có bỏ qua khối 'suy nghĩ', token `<thinking>`, hay chỉ đơn thuần là thay đổi prompt để giảm mức độ suy luận?

#Ollama #AI #LLM #GPTOSS #Reasoning
#MôHìnhAI #SuyLuận #CôngNghệ

reddit.com/r/ollama/comments/1

2025-11-26

Swe-rebench được coi là benchmark quan trọng cho tiến độ AI coding nhưng đang đối mặt nhiều vấn đề: thiếu log, đánh giá mô hình mã nguồn mở kém, chọn nhiệm vụ thiên vị, và agent cứng nhắc. Cần cải thiện quản lý để nâng cao độ tin cậy và theo dõi sự phát triển thực tế của các mô hình AI trong lập trình.

#AI #Coding #Benchmark #swe_rebench #TríTuệNhânTạo #MôHìnhAI #ĐánhGiá

reddit.com/r/singularity/comme

2025-11-14

Lựa chọn mô hình AI phù hợp cho dự án của bạn! Hãy xem xét: mục đích sử dụng, tốc độ phản hồi, ngân sách, độ tin cậy. #AI #MôHìnhAI #DựÁn #LựaChọn #TríTuệNhânTạo #ArtificialIntelligence #MachineLearning

reddit.com/r/LocalLLaMA/commen

2025-11-12

Tìm kiếm mô hình AI phù hợp cho nhu cầu của bạn chỉ trong vài giây! Công cụ mới giúp tìm mô hình AI tốt nhất cho ứng dụng, tự động hóa hoặc khám phá AI. #AI #MôHìnhAI #TìmKiếm #TríTuệNhânTạo #ArtificialIntelligence #AIModel #SearchTool

reddit.com/r/SideProject/comme

2025-11-08

Làm thế nào để cung cấp tài liệu kỹ thuật cho mô hình AI địa phương? Người dùng muốn kết nối mô hình AI với tài liệu để hỗ trợ coding. #LLM #AI #MôHìnhAI #TàiLiệuKỹThuật #LocalLLaMA #ArtificialIntelligence #MachineLearning

reddit.com/r/LocalLLaMA/commen

2025-11-07

Một cách độc đáo để chạy các mô hình AI trên thiết bị di động! Dự án ToolNeuron cho phép bạn đưa sức mạnh AI đến thẳng chiếc điện thoại của mình. Khám phá giải pháp mới giúp AI di động trở nên dễ dàng hơn bao giờ hết.
#AI #MobileAI #EdgeAI #ToolNeuron #ArtificialIntelligence #DiDong #MoHinhAI #CongNghe

reddit.com/r/LocalLLaMA/commen

2025-11-06

Nền tảng AI mới cho phép trò chuyện miễn phí với các mô hình AI như GPT và Claude, tìm kiếm thông tin với trích dẫn, chia sẻ tệp và URL, và thậm chí trò chuyện với cơ sở dữ liệu SQL. #AI #TríTuệNhânTạo #NềnTảngMới #GPT #Claude #TìmKiếm #CơSởDữLiệu #SQL #TròChuyện #MôHìnhAI #CôngNghệMới #Innovation #ArtificialIntelligence #NewPlatform #EmergingTech

reddit.com/r/LocalLLaMA/commen

2025-11-03

Một người dùng đã thử nghiệm mô hình AI MiniMax-M2 bằng cách yêu cầu nó tạo game Asteroid bằng HTML. Kết quả gây bất ngờ: tốc độ xử lý nhanh, tự động sửa lỗi 100% ở lần thứ hai và tích hợp âm thanh, hiệu ứng hình ảnh mà không cần nhắc. Người dùng đánh giá cao khả năng "suy nghĩ" của mô hình này.
#MiniMaxM2 #AI #Gaming #LocalLLaMA #MôHìnhAI #Game

reddit.com/r/LocalLLaMA/commen

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst