#%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B9

2025-05-02

«Отчет Creator» или как стать героем в глазах одногруппников

Вы когда-нибудь сталкивались с ситуацией, когда вдохновение от названия курса разбивается о рутину формальностей? Дисциплина «Алгоритмы и структуры данных» звучит захватывающе — кажется, вот оно, погружение в мир оптимизации и элегантных решений! Но уже на первом занятии нам объявили: «По каждому разделу — отчет с кодом, скриншотами, пояснениями и строгим соблюдением ГОСТа». Моя первая реакция: «Ну вот, опять…» (цензура соблюдена). Представьте: десятки задач, а к каждой — скриншоты редактора с кодом, подписи в формате «Рисунок 1.2 — Реализация сортировки кучей», выравнивание по шаблону, бесконечные правки форматирования. На один такой отчет уходило до двух часов. После месяца мучений я понял: так дело не пойдет. Так и родился мой спасительный проект — «Отчет Creator».

habr.com/ru/articles/906470/

#парсинг #ворд #обработка_изображений #api

2025-05-02

[Перевод] Децензурировать видео теперь проще, чем когда-либо

В прошлом месяце попросил ребят взломать часть моего видео на YouTube . Конкретнее — восстановить содержимое папки, которую «запиксил» начиная с отметки времени 4:57. Годами все так делают, чтобы размазать, точнее, «расквадратить» части видео с конфиденциальной информацией. И все это время слышно: — Небезопасно же! Захотят — прочитают! Так это правда? Как на самом деле‑то? Вопрос не праздный. Чтобы докопаться до истины, кинул клич: — Пятьдесят баксов тому, кто скажет, что написано под квадратиками!

habr.com/ru/companies/selectel

#selectel #информационная_безопасность #обработка_изображений #реверсинжиниринг #восстановление_изображений #tensorflow #github #депикселизация #пикселизация #размытие

2025-04-21

Цветовая вычислительная фотография. Часть 1: Теория цвета

Приветствую! Меня зовут Егор Ершов, я руковожу группой «Цветовая вычислительная фотография» в AIRI, а также заведую сектором репродукции и синтеза цвета ИППИ РАН. Область моих научных интересов касается способов регистрации и обработки изображений, что в той или иной степени касается любого человека, кто хоть раз пользовался камерой, монитором или проектором. Вычислительная фотография лежит на стыке сразу нескольких дисциплин: физики, физиологии, компьютерных наук. Из‑за этого в ней ещё много сложного, но вместе с тем интересного и неизвестного. Я подготовил полноценный курс по алгоритмам вычислительной фотографии для МФТИ и ВШЭ, но мне также хотелось бы поделиться со всеми желающими его материалами в текстовом формате. Этот курс посвящен как феномену цвета, механизмам его восприятия, исследованию зрительной системы человека, так и непосредственно алгоритмам цветовой вычислительной фотографии. Но в этой статье я бы хотел в общих чертах обрисовать проблему регистрации изображений, а также дать введение в теорию цвета, которая потребуется в дальнейших частях.

habr.com/ru/companies/airi/art

#цвет #камера #камера_смартфона #обработка_изображений #теория_цвета #вычислительная_фотография

2025-04-13

Прототип для металлографа: анализ включений на Python с OpenCV и PyQt

В профессии инженера-металловеда мне ежедневно приходится анализировать микроструктуру материалов и неметаллические включения. До недавнего времени я, как и многие, делал это вручную: окуляр микроскопа, шкалы, подсчёты, Excel. Утомительно и долго. На фоне постоянного потока образцов нагрузка на глаза и внимание становится ощутимой. Коммерческие программы для металловедов решают эту проблему... почти. Они избыточны, дороги, и процентов на 90 включают функции, которыми обычный инженер не пользуется. Хотелось чего-то проще, точнее и, желательно, бесплатного. Так родился мой проект SenseOptics KANV.

habr.com/ru/articles/900454/

#автоматизация #компьютерное_зрение #обработка_изображений #opencv #pyqt #металлография #python #научный_софт #инженерные_разработки #распознование_изображений

2025-04-10

Путь видео в онлайн-кинотеатрах от «стекла до стекла». Middleware — ядро, подписки, сервисы, витрина

Привет, Хабр! Снова с вами Дмитрий Новожилов — техлид онлайн-кинотеатра KION. В прошлый раз я рассказал , откуда берется контент на киносервисах и как он обрабатывается. Для этого разобрал источники данных и элемент Headend, включающий пункт приема сигнала, кодер и пакетайзер. На предварительных этапах контент нормализуется, делится на чанки, обрабатывается DRM и попадает в «сердце видеосервиса» — Middleware. Это тот самый элемент, который управляет контентом, когда вы открываете приложение на умном телевизоре или смартфоне. Он обеспечивает логику работы витрины: когда вы заходите в сервис, показывает доступный на площадке контент. Затем вы выбираете нужный фильм и получаете его через ближайший узел CDN. В этом посте я расскажу, какие компоненты и сервисы объединяются термином Middleware и что конкретно делает этот комплекс.

habr.com/ru/companies/ru_mts/a

#онлайнкинотеатр #видеоплатформа #видеосервис #Middleware #iptv #обработка_изображений #работа_с_видео

2025-04-04

[Перевод] Современные форматы изображений в Discord: поддержка WebP и AVIF

В течение последнего полугода команда Discord по обслуживанию медиа-инфраструктуры модернизировала конвейер обработки изображений, добавив поддержку анимированных форматов WebP и AVIF. Теперь на платформе можно делиться анимированными картинками WebP и AVIF как в виде прикреплённых файлов, так и в виде вставок. При этом все эмодзи выдаются в виде анимированных WebP — и бесшовно отображаются на любой платформе Discord. Эти изменения были реализованы для того, чтобы повысить качество анимации и воспроизведения роликов на всех платформах. При этом одновременно резко уменьшается размер файлов, и поэтому их загрузка ускоряется!

habr.com/ru/articles/897698/

#discord #webp #avif #gif #обработка_изображений #оптимизация #эмодзи

2025-04-02

Старый конь борозды не испортит: классические методы обработки изображений все ещё актуальны

Что такое цифровая обработка изображений? Зачем нам вообще знать про алгоритмы обработки, когда есть фотошоп и фильтры в телефоне? Или всё можно отдать нейросети и получить крутой результат? И при чём тут Julia, наконец? Будем разбираться! Мы запускаем серию статей про обработку изображений с использованием языка Julia и вычислительной среды Engee . Задача – ответить на часто встречающиеся вопросы вроде актуальности этого направления компьютерной науки, задач, решаемых методами обработки изображений, применения и реализации стандартных и «умных» алгоритмов. В первой части ознакомимся с основами на примере сегментации спутникового снимка.

habr.com/ru/companies/etmc_exp

#Julia #Engee #MATLAB #обработка_изображений #сегментация #спутниковые_снимки #морфология #бинаризация #предобработка #фильтрация_изображений

2025-02-21

Обработать ночные снимки с телефона до уровня профессиональной камеры: челлендж в рамках воркшопа NTIRE 2025

Ночная фотография — одна из самых трудных областей обработки изображений. Сложные условия освещения, повышенные шумы и нестандартные цветовые переходы создают серьезные преграды для алгоритмов, ориентированных на дневной сценарий. Однако совместными усилиями теоретиков и практиков возможно создать методы, позволяющие даже для ночных снимков со смартфона поднять качество до уровня профессиональной камеры. Именно поэтому мы, команда исследователей из AIRI и ИППИ РАН, проводим в рамках воркшопа NTIRE при конференции CVPR 2025 «Night Photography Rendering Challenge 2025», в котором могут принять участие коллективы со всего мира, увлекающиеся наукой о данных и машинным обучением. Подробности — в тексте ниже.

habr.com/ru/companies/airi/art

#фотография #челлендж #соревнования #обработка_изображений #обработка_фотографий

2025-02-21

Как мы ловили комету C/2023 A 3 — интервью с астрономом

Кометы, эти сгустки низкотемпературных льдов, способные образовывать кому и хвосты во время сближения с Солнцем, — обычное дело для академической астрономии. Общее число комет в поясе Койпера и облаке Оорта измеряется в 1012 объектов по нижней границе. Тем не менее сближение яркой кометы с Землёй и её наблюдение невооружённым глазом — достаточно редкое явление, которое неизбежно вызывает общественный резонанс. Вслед за ним происходит ожидаемый всплеск интереса к космосу. За примерами далеко ходить не надо — в октябре 2024 года своим появлением нас порадовала C/2023 А 3 Цзыцзиньшань/ATLAS . О том, легко ли «поймать» комету в объектив камеры, какое оборудование и софт лучше использовать, а также что изменилось для городской астрономии за прошедший год, рассказывает Алексей Репях — популяризатор науки и руководитель проекта «Звездонавты» . Сообщество, созданное Алексеем, смогло получить уникальные снимки кометы C/2023 А 3 Цзыцзиньшань/ATLAS , а также стать первой любительской группой, которая осуществила фотофиксацию этого небесного тела с территории России. К окулярам!

habr.com/ru/companies/first/ar

#астрономия #астрофотография #интервью #комета_понсабрукса #комета #космос #фотография #фототехника #телескопы #обработка_изображений

2025-02-21

Миллиарды векторов и немного магии: превращаем сырые данные с маркетплейсов в пригодные для анализа

Привет, Хабр! Я — Игорь Старун, BigData Lead в MPSTATS. Я уже 3 года занимаюсь анализом данных на маркетплейсах, штудируя гигантские объёмы информации и превращая их из непотребного и нечитаемого вида в удобоваримый и анализируемый. Моя задача — собрать и подготовить данные так, чтобы помочь продавцам на маркетплейсах разобраться, что происходит с их товарами, конкурентами и продажами, чтобы они не утонули в хаосе карточек, цен и остатков. В этой статье я расскажу, как мы перерабатываем эти объемы грязных данных и структурируем для дальнейшего анализа. Данные о товарах – это основа всего. Каждую неделю мы обходим более 200 миллионов карточек с Wildberries и Ozon. Названия, описания, характеристики, фотографии — всё это мы аккуратно собираем и складываем в базы данных (для разных задач мы используем ClickHouse, Postgres, MySQL и MongoDB) и облачные хранилища. Зачем? Чтобы потом сделать с этим что-то умное и полезное. Читать дальше

habr.com/ru/companies/mpstats/

#аналитика #маркетплейсы #эмбеддинги #faiss #семантический_поиск #обработка_изображений #seoоптимизация #big_data #искусственный_интеллект #нейросети

2025-02-18

Фильтр Гаусса на стероидах: подход на точность вычислений

Hello, world! Это вторая часть хабростатьи Smart Engines про быструю фильтрацию изображений. Да-да, создавая топовый продукт по распознаванию документов , нам приходится разбираться в методах обработки изображений на экспертном уровне (иначе не получилось бы распознать изображение паспорта за 150 мс на мобильном телефон). В предыдущей части мы начали обсуждать быстрые аппроксимации гауссовского фильтра, которым была посвящена наша недавняя публикация в научном журнале MDPI Applied Sciences [1]. О том, как работает оригинальный фильтр Гаусса, мы уже писали, сейчас мы только напомним о его использовании всюду, где возникает обработка изображений: от редактирования фотографий на смартфоне – для размытия фона за объектом в режиме "портрет", до анализа рентгеновских снимков – чтобы убрать шум и улучшить читаемость изображения.

habr.com/ru/companies/smarteng

#обработка_изображений #ускорение #аппроксимация #гауссовский_фильтр #алгоритмы

2025-02-10

Threshold U-Net: как мы отказались от высокого разрешения и выиграли в скорости бинаризации

Хоть современный ИИ уже почти в состоянии написать симфонию и превратить холст в шедевр, некоторые простые задачи все еще не так просты, если наложить ограничения на решение. Так как главной задачей у нас, в Smart Engines , является распознавание и оцифровка документов , то для нас ограничениями являются скорость работы и возможность запуска системы на вычислительно слабых конечных устройствах. В этой статье мы вспомним об одной классической задаче обработки изображений – бинаризации документов. А также расскажем, как нам удалось существенно оптимизировать нейросетевую модель бинаризации, сохранив исходное качество, и причем тут современные модели детекции текста.

habr.com/ru/companies/smarteng

#машинное_обучение #unet #нейронные_сети #бинаризация #обработка_изображений #smart_engines #алгоритмы

2025-02-04

В один клик — как я тестировал фильтры для фото

Похоже, моя кузина становится для меня музой. В прошлый раз она мне подсказала тему для статьи про видео. А на днях мы с ней болтали, и сестренка спросила: мол, вот ты — фотограф, а скажи, какие ты знаешь интересные фильтры для обработки фото, и вообще, что сейчас в моде. Признаться, вопрос меня поставил в тупик. Я, конечно, пользуюсь пресетами при обработке. В свое время написал для себя несколько сценариев в Adobe Lightroom и ранних версиях Photoshop. Однако сейчас я больше предпочитаю штучную обработку в Фотошопе, а стилизация снимков зависит от сюжета, цели, в конце концов, от настроения. Но никак не от моды. Тем не менее вопрос заставил задуматься. И вот как-то сложилось, что работу я закончил, планов не было, а времени свободного оказалось внезапно много. И решил пошерстить интернет на предмет поиска тенденций в фильтрах. Информации вылезло много, но я обратил внимание вот на этот материал . По совпадению, я в свое время, тестировал редактор, фильтры из которой здесь описываются — как альтернативу Photoshop для одной из статей . Чтобы изучить все возможности, я приобрел платную версию, а лицензия у нее — бессрочная. Так что прога по-прежнему стоит на моем старом ноутбуке, благо системные требования у софта очень гуманные. Кстати, надо заметить, что ФотоМАСТЕР — программа необычайно удобная для новичков и любителей. Так, она сильно приглянулась моей сестренке. В редакторе она делает коллажи или создает мемы и открытки со стикерами и надписями. Но больше всего кузине нравится функция «Идеальный портрет» и возможность AI-пластики лица и фигуры. С ними она превращает свою и без того симпатичную мордашку в эталон красоты, или делает талию еще тоньше.

habr.com/ru/articles/879276/

#обработка_изображений #фильтры_изображений #фотография #работа_с_фото #работа_с_фотографиями

2025-01-28

Фильтр Гаусса на стероидах: секреты ускорения вычислений

Привет, Хабр! Представьте, что вы пытаетесь обработать фотографию высокого разрешения на вашем смартфоне — добавить размытие, убрать шум или улучшить качество изображения. Кажется, задача проста, но за кулисами работает алгоритм, требующий немало вычислительных ресурсов. Речь идет о фильтре Гаусса – одной из самых популярных операций в области компьютерной обработки изображений. Для каждого пикселя нужно выполнить множество операций сложения и умножения, особенно если размер фильтра велик. Это становится серьёзным препятствием, когда есть требования к работе в режиме реального времени, например, при обработке видео, адаптации для беспилотных летательных аппаратов и пр. Но что, если сказать, что такие вычисления можно ускорить в десятки раз с незначительной потерей качества?

habr.com/ru/companies/smarteng

#гауссовский_фильтр #ускорение #аппроксимация #обработка_изображений #smartengines

2025-01-06

Как добавить надпись на картинку

Я люблю работу с изображениями. Не очень разбираюсь, но люблю. Всегда с интересом читаю статьи про методы триангуляции, детектирования границ, фильтры, перцептивные хэши, форматы изображений. Лет 10 назад даже пилил по вечерам конвертер из растра в вектор, но тот проект так и остался незаконченным. А теперь мы с командой разрабатываем PIM-систему, это инструмент по управлению информацией о товарах. Среди задач в беклоге я нашел задачу себе по душе: попробовать реализовать массовую генерацию инфографики для маркетплейсов. А в этой статье я хочу рассказать о подходе, который я использовал.

habr.com/ru/articles/871810/

#обработка_изображений #инфографика #маркетплейсы

2024-12-12

Homo clickus. Как моделирование кликающих людей пригодится для сегментации изображений

Приветствую всех читающих! Меня зовут Антон Антонов, я инженер по искусственному интеллекту, работаю в Институте искусственного интеллекта AIRI в команде, которая занимается Embodied AI — областью, связывающей робототехнику, компьютерное зрение и большие языковые модели. Недавно наша группа получила приятное известие: нашу статью с описанием модели того, как люди кликают и тапают на картинки, приняли на грядущий NeurIPS! Она будет полезна, чтобы тестировать модели интерактивной сегментации, которые помогают автоматизировать и ускорить процесс разметки изображений человеком. Ниже я хотел бы подробнее рассказать о нашей разработке. Кликнуть

habr.com/ru/companies/airi/art

#интерактивная_сегментация #сегментация_изображений #компьютерное_зрение #разметка_данных #обработка_изображений #искусственный_интеллект #глубокое_обучение

2024-12-10

Как улучшить распознавание маркировки с помощью нейросети

Наверняка многие из вас пользовались кассами самообслуживания в супермаркетах и пробовали отсканировать DataMatrix код «Честный знак» с упаковок мороженого, творога, молока, глазированных сырков и прочих продуктов в тонкой и гибкой упаковке. Согласитесь, редко получается сделать это с первого раза. А теперь представьте такую ситуацию на производстве, где нужно массово агрегировать всю продукцию с маркировкой, а она не распознаётся! Именно такую проблему мы и старались решить с помощью нейросети

habr.com/ru/articles/865534/

#промышленная_автоматизация #промышленное_программирование #обработка_изображений #неросети #компьютерное_зрение #машинное_зрение

2024-11-11

Поиск по фото для Ozon и Wb за 3 часа

Как создать функционал поиска товара по фото буквально за считанные часы. Сравниваем альтернативные алгоритмы, разбираем сильные и слабые стороны каждого.

habr.com/ru/articles/857750/

#LLM #обработка_изображений

2024-11-07

Как лидар помог обнаружить древние города: что ученые узнали о Шелковом пути

Привет, жители Хабра! Это Даша Фролова из команды спецпроектов МТС Диджитал. Сегодня поговорим о древних городах — и не цифровых, а вполне реальных. Лидарное сканирование помогло обнаружить средневековые города, скрытые в горах вдоль Шелкового пути . Оказалось, что в горах Тянь-Шаня, которые всегда считались препятствием для торговли, существовали процветающие города — их роль в международной торговле прошлых столетий все это время оставалась незамеченной. Один из таких городов — Тугунбулак — поражает масштабами и архитектурой. В период расцвета он занимал площадь в 120 гектаров. Для сравнения: площадь Сиены, одного из главных городов Италии той эпохи, составляла 105 га. Что еще известно о Тугунбулаке и какой город обнаружили еще, рассказываю ниже.

habr.com/ru/companies/ru_mts/a

#лидары #археология #научнопопулярное #урбанизм #обработка_изображений

2024-11-06

Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python

В современном мире искусственный интеллект и машинное обучение стремительно развиваются, меняя нашу повседневную жизнь и открывая новые горизонты в различных областях. Одной из ключевых технологий, лежащих в основе этих достижений, являются сверточные нейронные сети ( Convolutional Neural Networks, CNN ). Эти мощные алгоритмы позволяют эффективно обрабатывать и анализировать изображения, что находит применение в самых разных сферах: от медицинской диагностики до систем безопасности. CNN подходит для классификации изображений, что делает её отличным выбором для задачи распознавания рукописных цифр.

habr.com/ru/articles/856426/

#сверточные_нейронные_сети #распознование_текста #машинное_обучение #обработка_изображений #tensorflow #keras #нейросеть #рукописные_числа #алгоритмы_свертки #python

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst