#%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5

2025-05-03

Обработка аудио на ESP32

В этой статье я хочу поделиться своим опытом портирования проекта распознавания музыкальных жанров аудиозаписей на ESP32-C3. Исходный проект взят из репозитория книги TinyML-Cookbook_2E . При анализе речи или других звуков важно выделить такие характеристики, которые отражают строение сигнала, но при этом не зависят от конкретных слов, громкости и других мешающих факторов. Для этого используют cepstrum , mel-cepstrum и MFCC - это шаги преобразования, которые переводят звук в удобную для анализа форму.

habr.com/ru/articles/906658/

#esp32c3 #tensorflowlite #u8g2 #mfcc #MAX9814 #машинное_обучение #аудио #dsp #mcsis

2025-05-02

Геометрия ландшафта потерь и «понимание» нейросети

Когда нейросеть обучается, ее функция потерь образует сложный ландшафт в пространстве параметров – с вершинами (области высокой ошибки) и долинами (области низкой ошибки). Свойства этого ландшафта – его кривизна , форма минимальных долин, спектр матрицы Гессе и пр. – могут многое рассказать о том, насколько модель усвоила закономерности данных . Идея состоит в том, что не все минимумы одинаковы: одни могут быть «плоскими» (широкими и неглубокими), другие «острыми» (узкими и крутыми). Считается, что геометрия такого минимума связана с тем, как хорошо модель обобщает знания за пределы обучающих примеров и насколько «осмысленно» (семантически обоснованно) она их усвоила. В данном обзоре мы рассмотрим, как характеристики ландшафта потерь служат индикаторами обобщающей способности , интерпретируемости , адаптивности модели и ее чувствительности к семантике данных, а также какие количественные метрики предложены для измерения этих свойств.

habr.com/ru/articles/906374/

#машинное_обучение #нейросети #функция_потерь #Гессиан #ландшафт_ошибки #обобщение #интерпретируемость #flat_minima #PACBayes

2025-05-01

Как бессерверные gpu делают AI доступным. Введение в платформу PrimeWay

Привет, Хабр! Сегодня мы поговорим о том, как бессерверные-технологии меняют мир GPU-вычислений. Если вы когда-нибудь сталкивались с машинным обучением, рендерингом анализа 3D-графики или большими данными, эта статья поможет вам сэкономить время, деньги и нервы.

habr.com/ru/companies/primeway

#mlops #devops #ai #ml #машинное_обучение #python #деплой #дообучение

2025-05-01

Почему GPT-чаты не крякают?

Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки. [ Первомай ]

habr.com/ru/articles/905310/

#машинное_обучение #искусственный_интеллект #suno_ai #yagpt #deepseek #chatgpt #udio_ai #claude #gigachat #llama

2025-05-01

MLSecOps: защита машинного обучения в эпоху киберугроз

MLSecOps: защита машинного обучения в эпоху киберугроз На днях исследователь Цзянь Чжоу сообщил о критической уязвимости (CVE-2025-32434), затрагивающей все версии PyTorch до 2.5.1 включительно. Ошибка устраняется только обновлением версии до 2.6.0. Уязвимость соответствует критическому уровню риска, и позволяет злоумышленнику выполнить произвольный код на стороне жертвы без какого-либо взаимодействия с пользователем. Единственным условием является факт загрузки модели, созданной атакующим, даже при якобы безопасном параметре weights_only=True. Эта опция ранее считалась надежной, но, как выяснилось, не спасала от угроз. Подобные инциденты с развитием и повсеместным распространением нейронных сетей будут происходить всё чаще. Это еще один повод начать внедрение инструментов и технологий MLSecOps, даже на базовом уровне. Всех желающих подробнее познакомиться с особенностями и перспективами направления MLSecOps, узнать про основные виды атак, базовые методы защиты и дополнительные источники для обучения, приглашаю под кат.

habr.com/ru/articles/906172/

#MLSecOps #HiveTrace #LLAMATOR #Искусственный_интеллект #Машинное_обучение #Кибербезопасность #OWASP_Top_10 #Data_Poisoning #Защита #Атака

2025-04-30

MLflow для исследований: как систематизировать ML-эксперименты

Когда речь заходит о таких инструментах, как Airflow, MLflow или Docker, многие сразу представляют себе продакшен-среду, и новичков это может пугать. Однако на самом деле эти инструменты полезны не только в проде или крупных компаниях. Сегодня я хочу рассказать об MLflow. Эта статья рассчитана на тех, кто только начинает свой путь в машинном обучении и обладает базовыми знаниями, а также на практикующих ученых в области ИИ, которые пока не знакомы с этим инструментом или сознательно им не пользуются.

habr.com/ru/articles/905986/

#mlflow #машинное_обучение #искусственный_интеллект #эксперименты #логирование #трекинг #mlops

2025-04-29

Кем стать: дата-сайентистом, аналитиком, инженером данных или ML

Data Science — обширная область знаний на стыке аналитики, статистики, математики, программирования и машинного обучения. Специалисты в этой сфере работают с данными — они их хранят, обрабатывают, анализируют, находят закономерности и используют для прогнозирования. Результаты труда используются для решения самого широкого круга задач — от повышения розничных продаж до анализа ДНК по результатам лабораторных тестов. С Data Science в ИТ связан ряд профессий. Наиболее востребованные из них — дата-сайентист, дата-аналитик, инженер данных и ML-инженер (специалист по машинному обучению). Узнаем, чем занимаются представители этих профессий, сколько зарабатывают и каковы их перспективы на современном рынке труда.

habr.com/ru/articles/905388/

#аналитик #data_science_digest #data_science #машинное+обучение #машинное_обучение

2025-04-29

Бинарная классификация одним простым искусственным нейроном. Личный опыт

Статья о том, как я обучал один простой искусственный нейрон проводить бинарную классификацию линейно-разделимого множества объектов. Рассуждения, результаты, выявленные особенности. Личный опыт.

habr.com/ru/articles/904230/

#искусственный_интеллект #классификация #программирование #python #нейрон #искусственный_нейрон #машинное_обучение

2025-04-25

Внутренний голос: как электроды и ИИ возвращают речь парализованным людям

Представьте ситуацию: вы составляете фразу в своей голове, но произносит ее компьютерный помощник, а не вы. Для миллионов людей, которые лишены речи из-за паралича, инсульта или нейродегенеративных заболеваний, это становится реальностью. Импланты, сверхтонкие электроды и искусственный интеллект позволяют преобразовать электрическую активность мозга в слова. От калифорнийских лабораторий до российских стартапов — ученые и компании учатся возвращать голос тем, кто молчал годами. Сегодня предлагаю разобраться, как это работает и какие проекты меняют жизни уже сейчас.

habr.com/ru/companies/ru_mts/a

#нейроинтерфейс #речь #искусственный_интеллект #машинное_обучение #здоровье #мозг

2025-04-24

Тестируем новые модели o3 и o4-mini от OpenAI

Привет! На связи Кирилл Филипенко, сисадмин

habr.com/ru/companies/selectel

#selectel #ai #openai #o3 #o4mini #нейросети #машинное_обучение #искусственный_интеллект

2025-04-24

ИИ пишет книги, рисует картины и снимает кино. Творцы, пора паниковать?

Сначала машины забрали у нас заводы, теперь добрались до искусства. Нейросети уже пишут романы, сочиняют симфонии и генерируют картины, которые продаются за сотни тысяч долларов. Так что закрываем ноутбуки, выбрасываем кисти и идём искать новую работу?

habr.com/ru/articles/903936/

#искусственный_интеллект #будущее_здесь #машинное_обучение

2025-04-24

Оптимизация стратегии взыскания с помощью ML-моделей

Привет! Меня зовут Мария Шпак, я лидер команды collection стрима моделирования розничного бизнеса в Департаменте анализа данных и моделирования банка ВТБ. Наша команда занимается разработкой моделей машинного обучения для различных процессов, в совокупности служащих для финансового урегулирования. Основной заказчик этих моделей – соответствующий департамент банка, целью которого является помощь клиентам, допустившим просрочку платежа или находящимся в графике, но имеющим риск просрочки (Pre-Collection). Наши коллеги предлагают клиентам различные инструменты урегулирования этой проблемы и в большинстве случаев добиваются скорейшего возврата клиента в график платежей и в статус добросовестного заемщика. Оптимизация стратегий финансового урегулирования предполагает учёт разных параметров ситуации клиента: причины возникновения просрочки, степени серьезности возникших у него проблем, а также наиболее удобных и эффективных способов установить с ним контакт.

habr.com/ru/companies/vtb/arti

#Машинное_обучение #big_data #collection #python

2025-04-23

Обработка геоданных для ML-задач. Часть 3: агрегирование данных и оценка пространственных шаблонов

Пространственное агрегирование помогает контролировать степень детализации данных в зависимости от пространственных характеристик отдельных записей. Эта операция может быть полезна, если вы хотите сравнить разные регионы по конкретному параметру, (например, плотность населения или динамика продаж), оценить значение признака на единицу площади (скажем, среднюю выручку магазинов на квадратный километр) или преобразовать набор точек в растровые пространственные данные. Важно учитывать, что агрегирование упрощает анализ , но «схлопывает» внутреннюю вариативность данных, типа как усреднённая температура по больнице может скрывать локальные перегретые серверные. Существует, по крайней мере, три метода пространственного агрегирования ...

habr.com/ru/companies/cinimex/

#геоданные #feature_engineering #python #postgresql #postgis #data_science #анализ_данных #машинное_обучение #машинное+обучение #машинное_обучениe

2025-04-22

«Чистый берег»: как нейросеть в облаке помогает с уборкой побережья Камчатки и Арктики

Ежегодно в Мировой океан попадает более 11 млн тонн пластика — его накопление в водоёмах угрожает не только отдельным видам птиц и животных, но и целым природным экосистемам. В России эта проблема проявляется не столь остро, как, например, в странах Юго‑Восточной Азии, но тем не менее морской мусор встречается регулярно. В 2024 году команда специалистов Дальневосточного федерального университета (ДВФУ), Кроноцкого заповедника, Центра технологий для общества Yandex Cloud и Школы анализа данных Яндекса (ШАД) запустила проект «Чистый берег», результатом которого стала разработка нейросети, обученной распознавать определённые виды мусора на побережье, что, в свою очередь, позволяет определить его массу и объём. Меня зовут Дмитрий Сошников , и в этом проекте я выступил в качестве научного руководителя студентов ШАД. В статье расскажем, как готовили данные и обучали нейросеть, какие технологии для этого использовали и как приложения на основе ML помогают планировать работу исследователей и волонтёров.

habr.com/ru/companies/yandex/a

#машинное_обучение #segment_anything #stargan #преобразование_фурье #gan #segformer #grabcut #глубокое_обучение

2025-04-17

Как готовить Triton: рецепты вашей собственной Inference-платформы

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel . Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест. В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели.

habr.com/ru/companies/selectel

#selectel #машинное_обучение #devops #инференс #mlмодели #инфраструктура

2025-04-17

Как готовить Triton: рецепты вашей собственной Inference-платформы

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel . Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест. В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели.

habr.com/ru/companies/selectel

#selectel #машинное_обучение #devops #инференс #mlмодели #инфраструктура

2025-04-17

Как ИИ воплощает мечты: персональный план развития за 5 минут

Недавно в Instagram завирусились рилсы, где пользователи показывают, как ChatGPT за пару минут составляет подробные планы: от саморазвития до инвестиций. Мы протестировали этот метод на реальных запросах и делимся результатами.

habr.com/ru/articles/901702/

#искусственный_интеллект #будущее_здесь #машинное_обучение

2025-04-16

[Перевод] Популярные API для работы с искусственным интеллектом

В 2025 году API для работы с искусственным интеллектом стали неотъемлемым инструментом для разработчиков, стремящихся быстро внедрять мощные AI-функции без необходимости глубоко разбираться в машинном обучении. В этой статье — практический обзор ключевых провайдеров AI API, таких как OpenAI, Anthropic, Google и AWS, а также новых решений вроде Groq и Cerebras, предоставляющих высокопроизводительные платформы инференса. Мы разбираем особенности, ценовые модели и сценарии использования, чтобы помочь вам сориентироваться в быстро развивающемся ландшафте технологий искусственного интеллекта.

habr.com/ru/companies/otus/art

#ai_api #ml #ds #искусственный_интеллект #машинное_обучение #api #ии

2025-04-16

Безумный Макс и мыши: цифровая копия зрительной коры мозга

Мозг является одной из самых сложных и малоизученных систем, с которой не может сравниться ни один компьютер. В рамках изучения работы мозга его сложность, простите за каламбур, усложняет этот процесс. Попытки расшифровать алгоритмы интеллекта мозга сталкиваются с рядом проблем ввиду его сложных и обширных нейронных цепей. Ученые из Стэнфордского университета (США) разработали ИИ-модель, ставшую цифровой копией визуальной коры мозга мыши. Как это им удалось, и насколько точна и сложна цифровая копия? Ответы на эти вопросы мы найдем в докладе ученых.

habr.com/ru/companies/ua-hosti

#мозг #нейронная_активность #цифровая_копия #цифровизация #визуальная_кора #иимодели #машинное_обучение #искусственный_интеллект

2025-04-15

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в

habr.com/ru/companies/doubleta

#swebench #ии #нейросети #ml #машинное_обучение #искусственный_интеллект #github #open_source

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst