#deeplearning

2025-12-11

GPU là cốt lõi cho huấn luyện mô hình ngôn ngữ nhờ xử lý song song và tính toán ma trận nhanh. Bài viết phân tích kiến trúc GPU, phân biệt vs CPU, vai trò của CUDA/Tensor Cores, và quản lý VRAM. Hiệu suất GPU được đo lường bằng FLOPS, quyết định tốc độ huấn luyện. #AI #ML #GPU #MôHìnhNgônNgữ #CôngNghệ #ParallelComputing #DeepLearning #CUDA #VRAM #FLOPS #HiểuGPU #MachineLearningVietNam

reddit.com/r/LocalLLaMA/commen

2025-12-11

Hôm nay khám phá kiến thức về GPU – linh hồn của mô hình ngôn ngữ. GPU xử lý siêu song song, lý tưởng cho matrix multiplication trong ML nhờ hàng nghìn CUDA và Tensor Cores. So sánh CPU (lõi mạnh, xử lý tuần tự) vs GPU (nhiều lõi, song song). VRAM quan trọng để lưu trọng số/activations, thiếu gây lỗi training. FLOPS đo tốc độ tính toán, nhưng phụ thuộc bandwidth và hiệu suất Tensor Cores. Hiểu GPU để tối ưu hiệu quả huấn luyện mô hình!

#AI #ML #GPU #DeepLearning #VRAM #CUDA #TensorCore #FLOPS

Dutch AI Conferencedutchaicon
2025-12-11

We’re looking for sponsors who love tech, creativity and community.
Join the Dutch AI Conference 2026 and reach other enthusiasts!

👉 More info: aiconference.nl/sponsors/packa

2025-12-11

Thí nghiệm nhỏ với NanoGPT của Karpathy cho thấy mô hình dần học các đặc điểm ngôn ngữ từ dataset tiny_shakespeare. Dự án minh họa quá trình huấn luyện GPT thu nhỏ trên dữ liệu vở kịch của Shakespeare. #AI #Shakespeare #MachineLearning #NanoGPT #DeepLearning #KhoaHocMay #GPT #HocMay #ThuGon #NgônNgữHọcMáy

reddit.com/r/LocalLLaMA/commen

2025-12-10
FOSS Advent Calendar - Door 11: Read Any Text with EasyOCR

Meet EasyOCR, a lightweight open source optical character recognition (OCR) engine that makes extracting text from images and documents almost effortless. Supporting over 80 languages, including those with complex scripts and mixed language text, it's designed to be powerful, accurate, and incredibly straightforward to use.

Built on PyTorch and integrating deep learning models, EasyOCR delivers high recognition accuracy even on challenging images, low resolution, skewed text, or complex backgrounds. What sets it apart is its simplicity: with just a few lines of code, you can have a fully functional OCR pipeline running locally, without needing an internet connection or external APIs. Your data remains completely private.

Whether you're digitizing printed material, extracting text from screenshots (for example, lyrics from L’âme Immortelle, an Austrian dark wave band), automating document workflows, or analyzing visual data, EasyOCR gets the job done quickly and reliably.

Pro tip: Use it to create searchable PDFs, translate foreign text in images, or even capture and digitize handwritten notes with the right training data.

Link: https://github.com/JaidedAI/EasyOCR

What text would you like to extract from images? Scanned books, street signs, or maybe your old family documents?

#FOSS #OpenSource #OCR #EasyOCR #TextRecognition #AI #DeepLearning #Python #ComputerVision #DocumentDigitization #DataExtraction #Privacy #LocalAI #Multilingual #OpenTools #Fediverse #TechNerds #AdventCalendar #adventkalender #adventskalender #TextExtraktion #KI #PyTorch #DevCommunity #Automation #OfflineAI #PythonProgramming
2025-12-10

#NghiênCứu #AI #ĐạiNão #LLM #GPT #NgônNgữ #KhoaHọcNhiễmSắc
Nghiên cứu cho thấy cấu trúc thời gian xử lý ngôn ngữ của Não người tương ứng với cấp độ hệ thống của #LớpLLM (như GPT-2, Llama-2). Dữ liệu ECoG từ thí nghiệm 30 phút cho thấy lớp sâu của LLM liên quan đến hoạt động não trễ hơn, đặc biệt ở vùng Broca. Tập dữ liệu công khai hỗ trợ phát triển lý thuyết ngôn ngữ AI. #AI #Não #DeepLearning #Science #Neuroscience

*(500 characters)*

reddit.com/r/singularity/comme

2025-12-10

Người dùng Reddit đã xây dựng hệ thống gợi ý anime bằng Streamlit, sử dụng phương pháp content-based filtering và autoencoder (TensorFlow/Keras). Nhập tên anime để xem gợi ý tương tự. App demo sẵn sàng thử nghiệm, code source trên GitHub. #AI #Streamlit #Anime #DeepLearning #RecommenderSystem #SideProject #Python #GitHub #HọcMáy #DiễnGiảiSâu #PhânTíchDữLiệu

reddit.com/r/SideProject/comme

2025-12-10

Tìm mô hình chuyển giọng nói thành chữ nhỏ gọn, chính xác, hoạt động offline trên iOS - hỗ trợ đa ngôn ngữ (cần ít hơn vài trăm MB, không dùng mạng). Apple Speech framework chưa đủ offline, cần giải pháp chạy 100% cục bộ. #AIonDevice #SpeechToText #iOSDev #DeepLearning #TốiƯuHóaApp #OfflineProcessing #MLVietNam

reddit.com/r/LocalLLaMA/commen

Leanpubleanpub
2025-12-10

Mastering Modern Time Series Forecasting by Valery Manokhin is on sale on Leanpub! Its suggested price is $60.00; get it for $46.71 with this coupon: leanpub.com/sh/uSawg41o

2025-12-10

Hỏi về cài đặt và mở rộng LLM trên phần cứng hiện tại (Tesla V100 32GB) + lên đời GPU (V100 → RTX 5090?). Cần lời khuyên về kích thước mô hình tối đa (7B, 13B, 30B?), khung làm việc tốt nhất (vLLM, TensorRT-LLM...), tối ưu hóa phần cứng cũ và nên nâng cấp lên RTX 5090 hay GPU data-center (A100, H100). #AI #LLM #GPU #KỹThuậtHàngĐầu #Tech #MachineLearning #DeepLearning #HPC

reddit.com/r/LocalLLaMA/commen

Dutch AI Conferencedutchaicon
2025-12-10

🐦 Early bird tickets until 31 December!

Get your ticket at the best price and join hundreds of developers in Amsterdam for deep-dives, workshops, fun and good vibes.
👉 Secure yours now: dawntechnology.paydro.com/dac-

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst