#machinelearning

2025-12-11

A small number of samples can poison LLMs of any size \ Anthropic
> In a joint study with the UK AI Security Institute and the Alan Turing Institute, we found that as few as 250 malicious documents can produce a "backdoor" vulnerability in a large language model—regardless of model size or training data volume.
by Anthropic
anthropic.com/research/small-s
#ia #poison #machinelearning

2025-12-11

Cần tư vấn chọn mô hình LLM tốt nhất để phân tích chat log lớn (500k+ token) có đầu ra JSON cấu trúc. Hiện đang cân nhắc giữa GPT-4o (giỏi nhưng tốn kém), Llama 3.3 70B (hỗ trợ 200k-500k token?), hoặc Gemini 3 Pro/GPT-5. Ai có kinh nghiệm với ngữ cảnh dài và JSON, chia sẻ nhé! #AI #MachineLearning #LLM #ChatBot #PhânTíchDữLiệu #JSON #MôHìnhAI #TechVietnam

reddit.com/r/LocalLLaMA/commen

2025-12-11

Hội đồng AI cảnh báo: Tham số Min-P quá thấp khiến mô hình trí tuệ nhân tạo "bắt chước" nhau do đào tạo trên dữ liệu trùng lặp. Nghiên cứu chỉ ra cài đặt hiện tại (top-p 0.9, temperature 1.0; min-p 0.1, temperature 2.0) làm giảm tính sáng tạo. Cần điều chỉnh nào để tránh hiệu ứng "trí tuệ tập thể" và thay thế DRY/XTC bằng công cụ OpenRouter?
#AI #MachineLearning #MinP #Temperature #HivemindAI #ThietLapAI #TruongDaiHocAI #CongNgheAI

reddit.com/r/LocalLLaMA/commen

2025-12-11

Lightning-1.7B: Mô hình Qwen3 tinh chỉnh cho tự động đặt tiêu đề sáng tạo & tóm tắt ngắn nhờ dữ liệu Hermes. Ưu tiên chạy nền, xử lý nhanh các tác vụ cần mượt mà & phong cách: đặt tên cuộc trò chuyện, dịch câu hỏi thành công cụ tìm kiếm, giữ "cảm xúc" văn bản. Dùng tốt với 7B+, không thay thế tri thức dài hạn. #AI #MachineLearning #Vietnam #TríTuệNhânTạo #HọcMáy #MôHìnhLLM

reddit.com/r/LocalLLaMA/commen

The ML Engineermlblazeemail
2025-12-11
2025-12-11

**Unsloth công bố nghiên cứu huấn luyện mô hình 4B chỉ với 3 VRAM**
Nhóm Unsloth vừa phát triển cách huấn luyện mô hình AI 4 tỷ tham số (4B) chỉ cần 3 card VRAM, tiết kiệm tài nguyên đáng kể. Đây là bước tiến lớn, khiến các mô hình kín (closed models) phải cạnh tranh gay gắt hơn.

#AI #MachineLearning #NghiênCứu #Unsloth #MôHìnhMáyTính #KhoaHọcDữLiệu

reddit.com/r/LocalLLaMA/commen

Patrick :neocat_flag_bi:patrick@hatoya.cafe
2025-12-11

One Open-source Project Daily

ML.NET is an open source and cross-platform machine learning framework for .NET.

https://github.com/dotnet/machinelearning

#1ospd #opensource #algorithms #dotnet #machinelearning #ml

2025-12-11

Mistral vừa công bố mô hình thử nghiệm Mistral Large 3 có hỗ trợ **EAGLE speculative decoding**, hứa hẹn tăng tốc 3x mà không giảm chất lượng. Trước đó, llama.cpp từng đóng topic đề xuất hỗ trợ EAGLE (trước đây vì thiếu hứng thú). Giới AI liệu có quay lại quan tâm đến tính năng này?
#AI #Mistral #EAGLE #llama_cpp #ĐộVTính #MachineLearning #AIVietnamese

reddit.com/r/LocalLLaMA/commen

2025-12-11

Thí nghiệm nhỏ với NanoGPT của Karpathy cho thấy mô hình dần học các đặc điểm ngôn ngữ từ dataset tiny_shakespeare. Dự án minh họa quá trình huấn luyện GPT thu nhỏ trên dữ liệu vở kịch của Shakespeare. #AI #Shakespeare #MachineLearning #NanoGPT #DeepLearning #KhoaHocMay #GPT #HocMay #ThuGon #NgônNgữHọcMáy

reddit.com/r/LocalLLaMA/commen

2025-12-11

When appropriate I try to use the right term: #MachineLearning #LargeLanguageModel #GenerativeAdversarialNetwork I find myself putting "AI" in quotes when I type it. It does not understand, it does not think, it is not conscious, its job is to #replicate to #simulate to guess, probabilistically

Xavier Bonfillxavierbonfill
2025-12-10

📸

1️⃣ recent rehearsal with Sistro playing on the vssls ⚙️
2️⃣ short video from our first meeting in 2024 🏓
3️⃣ score for you score nørdzzz 🎼
4️⃣concert poster by Antonio Martinez

2025-12-10
(vessels)2 premiere on Dec 17!✨✨✨

Sistro Duo will premiere my new piece (vessels)2 next Wednesday (Dec 17) at Basement, Copenhagen ! You can find tickets here:
🔗🎟️ https://basement.kk.dk/program/xavier-bonfill-sistro-duo-vessels2

(vessels)2 is the second piece in the (vessels) workseries, but the first to be premiered. The piece is scored for two vssl, a “perceptual” sampler and granular synthesizer that I have been developing since 2023. This performance will also be a premiere of the instrument! 🎛️

(vessels) are hosts 🪺

(vessels) store memories 🗃️

(vessels) are always moving from A to B to all the other places they have to be. 🚢🛳️

The piece has been in the works for over a year. We met with Katerina Anagnostidou and Marta Soggetti in 2024 to record extensive sound libraries based around snare drum and bass drum 🥁The recordings were then edited and processed and loaded into vssl to create the final composition. ✂️🔉🤖✨

The commission of the piece has been made possible with kind support from #statenskunstfond & #kodakultur 🙏

And the event has been granted support from #kodakultur #danskmusikerforbund #knudhøjgaardsfond #vesterbrolokaludvalg 🚀






📸

1️⃣ recent rehearsal with Sistro playing on the vssls ⚙️
2️⃣ score for you score nørdzzz 🎼
3️⃣ concert poster by Antonio Martinez

#newmusic #experimental #electronic #liveelectronics #diyinstrument #puredata #arduino #raspberrypi #belatrill #sampler #audiodescriptors #machinelearning #composer #glitch #noise #avantgarde
2025-12-10

Trong video của Alex Ziskind về chiếc PC 2500W mạnh mẽ, anh sử dụng 2 card RTX Pro 6000 để chạy mô hình Qwen3 235B. Tuy nhiên, liệu cách này có đáng với chi phí cao hay nên chọn M3 Ultra 512GB với mô hình lớn hơn để cải thiện chất lượng? #TríTuệNhânTạo #LLM #CôngNghệ #MachineLearning #TươngLaiKỹThuật #AI #TechTrends

reddit.com/r/LocalLLaMA/commen

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst