#%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5

2025-10-17

GigaMemory: научи ИИ «помнить всё» с AI Journey Contest 2025

Мы всё чаще делегируем ИИ-ассистентам рабочую рутину и бытовые вопросы. Но во взаимодействии с ними есть существенная проблема: модели не помнят пользователя . Между сессиями теряются имя, контекст работы, желаемые ограничения и предпочтения, значительно влияющие на то, что и как стоит ответить пользователю. В итоге диалог каждый раз начинается «с нуля», а ответы звучат усреднённо. Это снижает эффективность и по доверие: когда ассистент не помнит важное о вас, он превращается в поисковик с красивыми фразами. Мы в команде RnD для B2C SberAI хотим это исправить. Представляем вашему вниманию задачу GigaMemory: global memory for LLM. Мы предлагаем участникам построить долгосрочную персональную память для языковой модели — систему, которая хранит, обновляет и надёжно извлекает знания о конкретном пользователе . Привычки, предпочтения, ограничения и прочие факты о пользователе, которые могут пригодиться в дальнейшем общении. Цель — научить ИИ отвечать не «в среднем по больнице», а исходя из вашего реального контекста: от прошлых задач на работе до семейных дат и спортивных планов.

habr.com/ru/companies/sberbank

#artificial_intelligence #natural_language_processing #большие_языковые_модели #хакатон #соревнования #хакатоны #машинное_обучение #память #gigachat

2025-10-16

H2O LLM Studio: как дообучить языковую модель под свои задачи, не привлекая внимания датасаентистов

Современные языковые модели (LLM) вроде GPT, LLaMA или Mistral обладают поразительной универсальностью. Они обучены на триллионах токенов из открытых источников и научились объяснять сложные вещи, поддерживать диалог в свободной форме и даже писать код. Однако при решении реальных бизнес-задач универсальность становится слабым местом: бизнесу нужны не «всезнающие ассистенты», а узкоспециализированные инструменты, хорошо понимающие внутренние процессы и терминологию.

habr.com/ru/companies/vktech/a

#vk_tech #llm #vk_cloud #H2O_LLM_Studio #ml #ai #нейросети #j #машинное_обучение #data_engineering

2025-10-16

И в дождь, и в снег: как мы детектируем загрязнения на лидарах автономного транспорта

Всем привет, меня зовут Всеволод Орлов, я работаю в команде восприятия мира в направлении автономного транспорта Яндекса. Сегодня я хочу рассказать про то, как мы учились определять степень загрязнения лидара — лазерного сенсора, установленного на наших автономных автомобилях и грузовиках. Тема, актуальная всегда, но особенно в российских погодных реалиях осени, зимы и весны. Расскажу, почему даже малейшее загрязнение лидара — проблема, почему эту проблему не так просто решить и какие есть подходы к этому решению, а в конце поделюсь нашими результатами.

habr.com/ru/companies/yandex/a

#автономный_автомобиль #машинное_обучение #алгоритмы #разметка #ml #ладар #железо

2025-10-14

Игра на опережение с LLM: с чем вышли на Q4 (анализ 134 195 научных работ 2025 года)

Чтобы понять, какие технологии будут определять рынок завтра, компании опираются на прогнозы/отчёты аналитиков или анализируют патенты. Но есть источник, который часто опережает и патенты – научные публикации. Далее о том, как я проанализировала 134195 научных статей 2025 года, чтобы ответить на вопрос, на какие технологии делать ставку прямо сейчас.

habr.com/ru/articles/956220/

#машинное_обучение #искусственный_интеллект #анализ_данных #нейросети #управление #llm #аналитика #тренды #будущее #алгоритмы

2025-10-13

Просто о сложном: Как работают нейросети

На эту тему есть масса статей и специфической литературы. Задайте поисковику этот вопрос и он выдаст вам десятки ссылок. Но ни одна из тех, что мне приходилось видеть, не описывает этот процесс языком, который был бы понятен глубокому гуманитарию. Обычно, под каждой такой статьёй какая-нибудь футуристическая картинка. Далее начинается история про нейроны мозга человека, что нейросеть на них похожа, активаторы, веса, слои... Ой, всё-о-о! Мне неоднократно приходилось это объяснять и люди понимали. Поэтому я решил поделиться своим опытом.

habr.com/ru/articles/956194/

#нейросеть #машинное_обучение

2025-10-13

Java против Python: Призрак с LTS-подпиской стучится в AI

2025 год. Эпоха, когда ИИ генерирует код, модели меняются каждые полгода, а техлид должен разбираться не только в паттернах, но и в условиях лицензионного соглашения.

habr.com/ru/articles/955500/

#java #Python #AIразработка #LTSподписка #Машинное_обучение #Производительность #Экосистема #Enterpriseрешения #Сравнение_технологий #Продакшен

2025-10-13

Что я вынес из Oxford Machine Learning Summer School 2025

Побывал на Oxford Machine Learning Summer School 2025 — одной из крупнейших летних школ, посвящённых искусственному интеллекту, проходившей в самом центре Оксфорда. В течение четырёх дней мы слушали лекции исследователей из DeepMind, Hugging Face, Amazon, Google, ученых топовых европейских вузов. Обсуждали foundation models, reinforcement learning, generative AI и on-device ML. В статье делюсь своими впечатлениями и кратким пересказом программы, отражающей мировые тренды в развитии современного машинного обучения.

habr.com/ru/articles/956138/

#машинное_обучение #llm #computer_vision #multimodal_llm #generative_ai #reinforcementlearning #edge_ai #diffusion_models #образование_в_it #oxford

2025-10-10

Борьба с дисбалансом классов. Undersampling

Привет, Хабр! На связи KozhinDev и ml-разработчик Приходько Александр. Это вторая статья в цикле публикаций по теме борьбы с дисбалансом классов в машинном обучении. В предыдущей статье мы рассмотрели актуальность данной проблемы и сравнили методы борьбы без внесения изменений в данные: балансировка весов классов и изменение порога принятия решения моделью. В данной части будем тестировать балансировку данных методом undersampling из библиотеки imblearn.

habr.com/ru/companies/kozhinde

#машинное_обучение #logistic_regression #xgboost #lightgbm #catboost #баланс_классов #undersampling

2025-10-10

Как мы запустили GPU NVIDIA H200 в Selectel, или почему в золотую лихорадку непросто продавать лопаты

Еще несколько лет назад флагманские GPU встречались в двух сценариях — дорогостоящее обучение моделей с чистого листа или претрейнинг крупных архитектур. Под такие задачи строили целые кластеры: длинные эпохи, десятки миллиардов параметров, месяцы непрерывных расчетов. Даже для обучения относительно «легких» моделей требовались серверы с 4−8 топовыми GPU. А уже сегодня можно заказать сервер сразу с восемью GPU H200, да еще и в формате SXM. Привет, Хабр! На связи Сергей Ковалёв, менеджер выделенных серверов в Selectel . В этой статье я расскажу, как индустрия оказалась в точке, когда нужны суммарные 1 128 ГБ видеопамяти и куда несется этот «локомотив». Под катом — все подробности.

habr.com/ru/companies/selectel

#ключевые_слова #nvidia #h200 #инференс #искусственный_интеллект #машинное_обучение

2025-10-10

Как мы запустили GPU NVIDIA H200 в Selectel, или почему в золотую лихорадку непросто продавать лопаты

Еще несколько лет назад флагманские GPU встречались в двух сценариях — дорогостоящее обучение моделей с чистого листа или претрейнинг крупных архитектур. Под такие задачи строили целые кластеры: длинные эпохи, десятки миллиардов параметров, месяцы непрерывных расчетов. Даже для обучения относительно «легких» моделей требовались серверы с 4−8 топовыми GPU. А уже сегодня можно заказать сервер сразу с восемью GPU H200, да еще и в формате SXM. Привет, Хабр! На связи Сергей Ковалёв, менеджер

habr.com/ru/companies/selectel

#ключевые_слова #nvidia #h200 #инференс #искусственный_интеллект #машинное_обучение

2025-10-09

Про технологии: Нейросети: +1 в команде, часть 1

Когда дедлайны дышат в спину, а компании нужно локализовать сотни обучающих видеороликов, то есть два варианта: 1. Уйти в дауншифтинг и завести ламу 2. Взять под контроль хаос мультиязычных видео, автоматизировать распознавание речи, оптимизировать процесс локализации и внедрить нейроозвучку Ну, собственно, мы выбрали второй вариант) Собственно, в статье мы расскажем про наш пайплайн локализации видео, с какими граблями столкнулись и почему теперь фразы в духе « А давайте добавим еще один язык? » нас уже не так уж и пугают.

habr.com/ru/companies/sportmas

#локализация #распознавание_речи #озвучка_видео #ии #искусственный_интеллект #машинное_обучение #нейросети

2025-10-09

Безопасность — это не отсутствие структуры, а наличие правильной структуры: топология как новый язык науки

В этой статье мы рассмотрим, как топологические методы меняют наше понимание безопасности. Мы увидим, что безопасность не достигается через максимальную случайность, а через специфическую, строго определенную топологическую структуру — тор с максимальной энтропией. Это не просто шаг вперед — это прыжок в новую эпоху, где безопасность перестает быть верой и становится наукой.

habr.com/ru/articles/954944/

#топология #криптография #ECDSA #безопасность #машинное_обучение #топологический_анализ_данных #гомология #персистенция #анализ_данных #биткойн

2025-10-09

Соревнование по машинному обучению — предскажите следующее состояние рынка

Привет, Хабр! Недавно мы запустили Wunder RNN Challenge — соревнование по машинному обучению, где нужно предсказывать следующее состояние рынка по последовательности предыдущих состояний. В этом посте мы расскажем, что это за состояние рынка , и в чём вообще прикол. 📅 Решения принимаются до 1 декабря 💰 Призовой фонд $13,600

habr.com/ru/companies/wunderfu

#соревнование #машинное_обучение

2025-10-08

Как я автоматизировал анализ логов из Kibana с помощью LLM и AI-агентов

Инструменты вроде OpenSearch, Elastic или Kibana давно стали стандартом для поиска и визуализации логов благодаря удобству и мощной поисковой системе. Однако, когда речь заходит о сложном анализе — агрегациях, парсинге, выявлении сложных закономерностей — их встроенные средства быстро достигают предела возможностей. Особенно сложно становится, если структура логов далека от идеала: например, как у нас — всё содержимое свалено в одно поле Message в формате JSON. Меня зовут Игорь Щегловитов, я работаю экспертом по тестированию в QC облачной инфраструктуры и веб-порталов. Раньше наша команда решала такие задачи кастомными утилитами на C#, которые выгружали логи из ELK и анализировали их локально. Однако каждое новое требование превращалось в мини-проект: доработать код, написать новые парсеры, скрипты агрегации и фильтрации. Работа замедлялась, техдолг рос. Я решил использовать связку AI-агентов с кастомными промптами, собственный сервисный слой (MCP) для доступа к логам и LLM-модель, чтобы превращать пользовательские запросы в автоматический алгоритм анализа. Так, кейсы вроде «Посчитай уникальных пользователей за сутки» или «Проанализируй ошибки за период» решаются без ручного кодинга. Под катом мой кейс: расскажу, как это сделал, поделюсь ссылкой на гитхаб, так что, если хотите упростить себе анализ логов, — эта статья для вас.

habr.com/ru/companies/kaspersk

#kibana #opensearch #ai #roocode #логи #llm #машинное_обучение #тестирование #roo_code #elasticsearch

2025-10-08

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

Сколько раз вы начинали новый ML-проект и первым делом отправлялись на поиски подходящих данных? Процесс этот знаком каждому: есть задача, выбрана архитектура модели, но без качественного датасета дальше не продвинуться. Тут и начинается квест по бесконечному поиску «того самого» набора по репозиториям, форумам и каталогам. Хороших датасетов множество, но найти среди тысяч вариантов нужный — отдельная история. Чтобы облегчить вам эту задачу, мы сделали подборку датасетов, которые активно используются ML-инженерами: от классических наборов данных, известных каждому, до новичков в информационном поле.

habr.com/ru/companies/magnus-t

#машинное_обучение #датасеты #наборы_данных #подборка_датасетов_для_ML #где_искать_датасет #обучение_моделей #компьютерное_зрение #обработка_естественного_языка #MLрепозитории #распознавание_речи

2025-09-26

T-ECD — кросс-доменный датасет для исследований в области рекомендательных систем

Всем привет! На связи команда RecSys R&D Т-Банка. В экосистеме Т мы развиваем рекомендации практически во всех сервисах — от инвестиций до доставки продуктов и кэшбэка. Представляем открытый синтетический датасет T-ECD — T-Tech E-commerce Cross-Domain Dataset. Он создан на основе реальных данных Т-Банка и предназначен для исследований в области рекомендательных систем. Под синтетичностью мы понимаем то, что датасет насемплирован из реального распределения, поэтому обладает очень похожими на реальность статистическими свойствами данных, но при этом полностью анонимный и обезличенный. Рассказываем, как T-ECD устроен и что внутри. Полный датасет и его уменьшенная версия T-ECD-Small уже доступны на Hugging Face.

habr.com/ru/companies/tbank/ar

#рекомендательные_системы #машинное_обучение #датасеты #opensource

2025-09-26

[Перевод] ML Q & AI. Глава 9. Генеративные ИИ модели

← Предыдущая глава | Какие существуют популярные категории глубоких генеративных моделей (также известных как генеративные ИИ) в области глубинного обучения, и какие у них недостатки? Для создания различных форм информации, таких как изображения, видео, тексты и аудио, было разработано множество глубоких генеративных моделей. Кроме того, эти модели могут быть адаптированы для генерации данных, специфичных для конкретных областей, например, для моделирования органических молекул и белковых структур. В этой главе мы сначала рассмотрим определение генеративного моделирования, а затем подробно опишем каждый тип генеративной модели, оценив их сильные и слабые стороны.

habr.com/ru/articles/948694/

#перевод #машинное_обучение #нейросети #глубинное_обучение

2025-09-25

Планы CS Space на осенний семестр

Как обещали в первом посте , возвращаемся с подробным анонсом осенних курсов. В этом семестре мы организуем большие и малые курсы, охватывающие несколько тем в компьютерных науках, искусственном интеллекте и математике.

habr.com/ru/articles/950722/

#курсы #наука #алгоритмы #математика #машинное_обучение #образование #computer_science #теория_вероятностей

2025-09-25

Почему молчит умный счетчик? Побеждаем коллизии в сетях NB-IoT

IoT-сети проектировали для миллионов устройств, но они захлебываются уже от тысяч. Когда в нашем районе на секунду моргнул свет, 10 000 умных счетчиков одновременно потеряли связь и начали переподключаться. Три четверти так и не смогли выйти в эфир. Проблема в RACH — канале случайного доступа. При массовых подключениях он превращается в узкое горлышко, куда каждый пытается прорваться первым. Меня зовут Максим Князев, старший системный инженер К2 Кибербезопасность , и я натренировал пять ИИ-агентов для управления этим хаосом. Один прогнозирует пики нагрузки, другой распределяет временные слоты, третий управляет мощностью передачи, четвертый распределяет устройства по типам и пятый оптимизирует расход батарей. В итоге количество коллизий упало с 26% до 7%, энергопотребление на 35%, а успешность подключений выросла до 96% по сравнению с использованием статического метода без агентов. Под катом рассказываю, как это работает.

habr.com/ru/companies/k2tech/a

#iot_security #ииагент #iotустройства #nbiot #reinforcement_learning #машинное_обучение #беспроводные_сети #беспроводные_технологии #интернет_вещей #обучение_с_подкреплением

2025-09-25

Алгоритм поиска аномалий Isolation Forest

Привет, Хабр! Меня зовут Михаил Васильев, я старший специалист по машинному обучению в компании Makves (входит в группу компаний «Гарда»). Эта статья — вторая в цикле, посвященном поиску аномалий. В первой статье мы поговорили о том, что такое аномалии и почему их сложно искать, а также по шагам разобрали алгоритмы HBOS и ECOD . Сегодня мы разберем еще один интересный алгоритм: Isolation Forest , а также немного углубимся в проблематику задачи.

habr.com/ru/companies/garda/ar

#isolation_forest #поиск_аномалий #алгоритмы #машинное_обучение #информационная_безопасность #виды_аномалий #ансамбли_алгоритмов #ансамблирование

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst