#Machine_Learning

2025-11-26

AI Routing Lab: машинное обучение для оптимизации сетевых маршрутов

Каждый маршрут ведет себя по-разному в зависимости от времени суток, загрузки сети, погоды (да, это влияет на спутниковые каналы) и других факторов. Традиционная маршрутизация выбирает путь на основе метрик BGP (AS Path, MED), но эти метрики не учитывают реальную задержку и джиттер.

habr.com/ru/articles/970630/

#Network_Routing #machine_learning #AI_Routing #quic #Network_Optimization #CloudBridge_Research #Open_Source #Jitter_Prediction

2025-11-20

Как я собрал и подготовил датасет дефектов печатных плат для обучения моделей YOLO

Когда пришло время выбирать тему диплома, я, как и многие студенты, понятия не имел, о чём писать. После мозгового штурма с одногруппниками родилась идея, которая из простого «варианта для защиты» превратилась в полноценный инженерный проект: «исследование и разработка системы автоматического распознавания дефектов печатных плат». Со временем я понял, что выбрал тему не случайно - это реально актуальная задача для производства, где качество пайки напрямую влияет на работоспособность устройств, а ещё отличный шанс пройти весь цикл Computer Vision проекта от сбора данных до обучения моделей. Эта статья краткая выжимка моего опыта: как собрал собственный датасет дефектов печатных плат для обучения моделей, какие инструменты использовал и на что стоит обратить внимание. Статья будет полезна:

habr.com/ru/articles/968626/

#yolo #dataset #labeling #PCB #обучение_моделей #разметка_датасета #computer_vision #machine_learning #машинное_обучение #учусь_программировать

2025-11-11

AI-инструменты 2025: Полный технический анализ Perplexity, ChatGPT, Gemini и DeepSeek

AI-инструменты 2025: Полный технический анализ Perplexity, ChatGPT, Gemini и DeepSeek Сравнение четырёх ведущих AI-инструментов 2025: Perplexity, ChatGPT, Gemini и DeepSeek. Анализ точности, безопасности, цены и оптимальных сценариев использования. Выбираем инструмент для вашей роли: исследователи, разработчики, data scientists и контент-мейкеры. Практические рекомендации и таблицы сравнения ключевых метрик.

habr.com/ru/articles/965390/

#AI #ChatGP #Perplexity #deepseek #Gemini #machine_learning #LLM

2025-11-10

At the Workshop on Geometry, Topology, and Machine Learning #GTML2025 , Anna Gilbert describes a whole field in #machine_learning that used problem atic benchmarks. When she tried to replicate the results, her team shows that usual NN were able to outperform the most advanced architectures in the field.

arxiv.org/abs/2412.06173

Hacker Newsh4ckernews
2025-11-06

I scraped 3B Goodreads reviews to train a better recommendation model

book.sv

2025-11-01

Профессия ML-инженер: как кошка съела акулу и почему ИИ должен дружить с БД

Руководитель отдела машинного обучения Postgres Professional Савелий Батурин рассказал, как он прошёл путь от первых экспериментов в 16 лет до ML-инженера, решающего задачи для СУБД. В статье — обзор ролей в индустрии, развенчание мифа о промпт-инженерах и список ресурсов, которые помогут оставаться в курсе событий.

habr.com/ru/companies/postgres

#ml #ии #икусственный_интеллект #machine_learning #mlинженер #mlспециалист #postgresql #postgres_pro #postgres_professional

2025-10-27

Momentum Attention: когда внимание получает инерцию

Внимание в трансформерах не имеет памяти между шагами, что ведет к нестабильным градиентам. Решение Momentum Attention, где текущие Value векторы смешиваются с предыдущими через экспоненциальное скользящее среднее. Этот подход добавляет инерцию, стабилизируя фокус модели. Внутри разбор механики, корректный код на PyTorch и анализ трейд оффов

habr.com/ru/articles/960624/

#transformers #attention #machine_learning #deep_learning #research #pytorch #нейросети #ai

2025-10-26

Умный Learning Rate Scheduler: Управляем скоростью обучения, анализируя ускорение

Классический ReduceLROnPlateau снижает скорость обучения, когда уже поздно модель упёрлась в плато. Я покажу, как сделать шедулер, который замечает замедление заранее, анализируя ускорение улучшений.

habr.com/ru/articles/960340/

#deep_learning #pytorch #machine_learning #learning_rate #optimization #ai

2025-10-20

[Перевод] Инструкция по бесплатной GPT генерации новых фичей для наращивания точности ML модели

Одним из самых важных навыков любого специалиста по данным или ML инженера является умение извлекать информативные признаки из исходного набора данных. Этот процесс называемый feature engineering (инженерия признаков), — одна из самых полезных техник при построении моделей машинного обучения. Работа с данными требует значительных инженерных усилий. Хотя современные библиотеки вроде scikit-learn помогают нам с большей частью рутинных операций, по-прежнему критически важно понимать структуру данных и адаптировать её под задачу, которую вы решаете. Создание новых, более качественных признаков позволяет модели лучше улавливать зависимости, отражающие особенности предметной области и влияющие на результаты факторы. Разумеется, feature engineering — это времязатратный, креативный и нередко утомительный процесс, требующий экспериментов и опыта. Недавно я наткнулся на интересный инструмент — Upgini . Следуя тренду на использование Large Language Models (LLM), Upgini применяет GPT от OpenAI, чтобы автоматизировать процесс feature engineering для ваших данных. Подробнее о python библиотеке Upgini можно почитать на GitHub странице проекта. У проекта уже 345 звездных оценок, что является показателем востребованности и полезности функционала. 👉 GitHub - upgini/upgini: Data search library for Machine Learning

habr.com/ru/articles/956310/

#python #gpt #openai #скоринг #auc #машинное_обучение #нейронные_сети #data_mining #data_science #machine_learning

2025-10-20

Что «под капотом» у DeepSeek-V3.2-Exp? Китайцы нашли способ удешевить нейросети

Привет, Хабр! Китай снова выпустил кое-что интересное, так что давайте разбираться. Еще в сентябре у китайцев вышла новинка — DeepSeek-V3.2-Exp, экспериментальная версия последней модели DeepSeek-V3.1-Terminus. Цели и задачи у них вполне определенные: сделать архитектуру трансформеров еще более эффективной. Причем на сайте Hugging Face говорится, что особый акцент стартап делает на повышение вычислительной эффективности при обработке длинных текстовых последовательностей.

habr.com/ru/articles/957252/

#исследование #deepseek #китай #ai #machine_learning #обзор #artificial_intelligence #нейросети #машинное_обучение #искусственный_интеллект

2025-10-18

You can't simulate excellent teaching.

> Analysis of the data revealed that the AI-generated lesson plans rarely cultivated higher order thinking or introduced diverse perspectives in each lesson.

Writeup
arstechnica.com/ai/2025/10/tea

Article
citejournal.org/proofing/civic

#machine_learning #ai #philosophy #teaching #pedagogy #llm #teaching

Image 1: Alt Text
Text block on light gray background with purple highlights marking key phrases. The text describes a study on AI-generated civic education lesson plans evaluated using Bloom's Taxonomy and Banks' multicultural model. Purple highlights emphasize findings that AI plans lacked higher-order thinking and diverse perspectives.
Caption
A Massachusetts study examined AI-generated civics lesson plans against educational standards for critical thinking and cultural diversity. Researchers found the AI tools rarely developed advanced reasoning skills or multicultural perspectives. The study recommends teachers carefully review and enhance AI-generated materials to ensure students receive rigorous, inclusive learning experiences that promote critical analysis.Image 2: Alt Text
Title slide with dark text on light gray background. Large heading reads "Civic Education in the Age of AI: Should We Trust AI-Generated Lesson Plans?" Authors listed below in alternating green and gray text: Torrey Trust, Robert Maloy, Chenyang Xu, and Kael Pelletier, all from University of Massachusetts Amherst.
Caption
This research presentation examines whether AI-generated lesson plans meet educational standards for civics instruction. Four University of Massachusetts Amherst researchers investigated AI's capacity to create materials that develop critical thinking and incorporate diverse perspectives. Their findings raise important questions about the role of artificial intelligence in preparing democratic citizens and supporting teacher workload.
2025-10-02

On Day 2 of European Galaxy Days, Arash Kadkhodaei presented 'Serving locally hosted LLMs with Galaxy'.

@galaxyfreiburg
#EGD2025 #ai #llm #galaxyproject #eosc #fair #machine_learning #open_science

Serving locally hosted LLMs with Galaxy
2025-09-25

[Перевод] Без тренировки, но с обучением: имплицитная динамика in-context learning

Одной из наиболее примечательных особенностей Large Language Models (LLM) является их способность к in-context learning — обучению в контексте. В частности, на этапе инференса LLM может усваивать новые паттерны без какого-либо дополнительного обновления весов, если эти паттерны представлены в виде примеров в промпте, даже если эти паттерны не встречались во время обучения. Механизмы, за счёт которых это возможно, всё ещё во многом остаются неизвестными. В данной работе мы показываем, что комбинация слоя self-attention с MLP позволяет трансформер-блоку неявно модифицировать веса MLP-слоя в зависимости от контекста. Мы утверждаем на основе теоретического анализа и экспериментов, что этот простой механизм может объяснять, почему LLM способны обучаться в контексте, а не только во время тренировки модели. В частности, мы демонстрируем, что при ряде упрощающих допущений трансформер-блок неявно преобразует контекст в low-rank обновление весов MLP-слоя.

habr.com/ru/articles/949064/

#llm #llmмодели #icl #mlp #ml #machine_learning #finetuning

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst