#ocr%D1%82%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D0%B8

2025-06-17

Что будет, если пригласить на свидание OCR и GPT?

Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics , со мной Александр Сулейкин , Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?». Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье.

habr.com/ru/articles/919104/

#open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocrтехнологии #idp #ocr #обучение_нейронных_сетей

2025-06-06

Как мы делали технологию, которая умеет верифицировать подписи в документах

Верификация подписи — новая полезная фича для работы с документами, которая войдет в наш кросс-платформенный продукт ContentCapture для интеллектуаль­ной обработки информации. Задача технологии — помогать пользователям проверять подлинность подписи на документах в автоматическом режиме, тем самым упрощая ежедневные бизнес-процессы и обеспечивая более высокий уровень безопасности. Ниже рассказываем, как мы создавали эту технологию.

habr.com/ru/companies/contenta

#подписи #верификация #ocrтехнологии #ocr #разработка #contentcapture #j #обучение_нейронных_сетей

2025-05-19

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!

habr.com/ru/companies/selectel

#selectel #python #javascript #распознавание_текста #ocr #ocrтехнологии #webпрограммирование

2025-05-19

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!

habr.com/ru/companies/selectel

#selectel #python #javascript #распознавание_текста #ocr #ocrтехнологии #webпрограммирование

2025-05-14

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито , занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции. Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей. А еще материал стоит прочитать тем, кто работает с доменами, где нужно иметь дело с задачами распознавания информации с документов — наш подход прекрасно переносится на другие категории. В целом рекомендую статью всем, кто интересуется компьютерным зрением и его применимостью в разных сферах.

habr.com/ru/companies/avito/ar

#Распознавание_текста_на_фото #распознавание_документов #компьтерное_зрение #ocr #ocrтехнологии #декомпозиция_задач #стс #fullstack_разработка

2025-04-23

[Перевод] Решалка судоку: сам не представляю, как она у меня получилась

В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.

habr.com/ru/companies/timeweb/

#timeweb_статьи_перевод #судоку #искусственный_интеллект #нейросети #игры #математика #логика #ocr #ocrтехнологии #логика

2025-03-20

Технологии распознавания паспорта – 10 лет. Хабрология от Smart Engines

Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр . Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории. Как это было?

habr.com/ru/companies/smarteng

#ии #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocr #ocrтехнологии #компьютерное_зрение #программирование

2025-03-05

Распознавание день в день: как настроить шаблон нового документа без программирования

Привет, Хабр! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации. Можно прийти с этой задачей к нам, и мы обязательно поможем. Но есть и альтернативный сценарий – встроить возможность настройки распознавания к себе. Для этого мы выпустили специальный инструмент – дизайнер форм . С ним ждать никого не придется, а добавлять распознавание новых форм можно будет по мере их появления, буквально день в день . О нем мы сегодня и поговорим.

habr.com/ru/companies/smarteng

#smart_engines #распознавание_образов #распознавание_изображений #документы #настройка_формы #ocr #ocrтехнологии #искусственный_интеллект #дизайнер #nocode

2025-02-25

Распознавание текста в банке: трудности и решения

Привет, Хабр. Я Александр Иванов, техлид команды компьютерного зрения. У любого банка очень много задач, связанных с документами. Особенно важна задача по оцифровке. Ее можно решить, скормив скан мощной мультимодальной LLM, но это работает не всегда. Поэтому мы разрабатываем специализированные решения по оцифровке разных текстов, о чем я и расскажу.

habr.com/ru/companies/tbank/ar

#llm #модели #ocr #ocrтехнологии

2025-02-11

Разворачиваем простой OCR-сервер на Python

Тема компьютерного зрения достаточно обширна: в ней рассматриваются различные способы распознавания статичных изображений и видео. Однако многие из предлагаемых в интернете решений требуют повышенных вычислительных мощностей, сложного ПО и специального оборудования. В этой статье мы не будем рассматривать что‑то сложное, а вместо этого разберём создание простого сервера для распознавания изображений на Python.

habr.com/ru/companies/otus/art

#computer_vision #ocrтехнологии #python #компьютерное_зрение #распознавание_изображений

2024-11-26

Оптимизировали 5 рабочих процессов с помощью AI. Не rocket science, но уже экономит ресурсы

Вероятно, вы уже видели новость от экс-data-подрядчика Google , что искусственный интеллект не оправдывает надежд бизнеса и вложенных в него денег. Проблема в том, что сделать AI реально полезным можно только после обучение нейросети на большом объёме ваших корпоративных данных (и на этом этапе всё обычно останавливается). Процессы, где внедрение AI сразу приносит пользу, тоже есть, но это не rocket science. В статье я покажу пять кейсов из нашей практики: расшифровку звонков и подготовку протоколов встреч, умный поиск по системе с OCR, распознавание и оцифровку документов (IDP) и AI-ассистента.

habr.com/ru/companies/1forma/a

#искусственный_интеллект #расшифровка_видеоконференции #саммаризация #ocrтехнологии #idp #ai_ассистент #bpm #bpms #автоматизация_бизнеспроцессов

2024-10-04

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

habr.com/ru/companies/smarteng

#распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocrтехнологии #ocr #компьютерное_зрение #тест #smart_engines

2024-09-19

Методы предпроцессинга в IDP-системе ITFB EasyDoc

Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.

habr.com/ru/companies/itfb/art

#ocr #ocrтехнологии #распознавание #распознавание_изображений #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста #idp

2024-09-11

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми . А для этого создать простую OCR явно недостаточно. Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать. Объясняем тут

habr.com/ru/companies/smarteng

#распознавание_речи #распознавание_документов #распознавание_паспорта #ocr #ocrтехнологии #icdar #репортаж #ии #обработка_изображений #обработка_данных

2024-08-22

Выбираем систему распознавания: 20 вопросов, которые нужно задать вендору перед внедрением

Сориентироваться на рынке технологий распознавания документов – задача непростая. А отнестись к выбору системы стоит, между тем, ответственно: от надежности разработчика ПО зависит, будет ли решение функционировать без сбоев и будет ли работать вообще. Чтобы в дальнейшем дорогостоящее IT-решение не разочаровало – мы, Smart Engines , подготовили универсальный чек-лист. Он поможет вам минимизировать риски (спойлер: их немало) при выборе разработчика системы оптического распознавания текста и подобрать оптимальное решение.

habr.com/ru/companies/smarteng

#ии #как_выбрать #как_выбрать_компанию #распознавание #ocr #ocrтехнологии #ocrskd #распознавание_образов #технологии #бизнес

2024-08-17

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

habr.com/ru/articles/836714/

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

2024-06-04

ML в OCR: зачем и как

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно начали использовать ML‑технологию для извлечения данных из высокоструктурированных документов. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

habr.com/ru/companies/slsoft/a

#ml #ocr #ocrтехнологии #SOICA #machine_learning #neural_networks

2024-04-26

Локальная REST-служба, или как за 5 минут интегрировать Smart ID Engine

Сегодня мы расскажем, как встроить нашу систему распознавания документов, удостоверяющих личность, Smart ID Engine в виде локально работающей службы с интерфейсом REST API.

habr.com/ru/companies/smarteng

#restful #rest_api #распознавание #ocrтехнологии #распознавание_паспорта

2024-03-15

Как выбрать и внедрить OCR-систему для распознавания и сверки документов

Приветствую, друзья! Меня зовут Александр Вихарев, и я работаю системным аналитиком в проектах для Fix Price. Одной из самых сложных задач при работе с документацией является сверка документов. Причем сверка трудна и с точки зрения программной реализации, если заниматься этим самостоятельно. Для нас же эта задача особенно важна, поскольку все документы должны подписываться только теми людьми, у которых есть на это полномочия. В противном случае это может привести к правовым и финансовым проблемам — например, при подписании договоров на оказание услуг. Также могут наблюдаться и несовпадения в предварительно согласованной и подписанной версиях, что при ручной проверке выявлять долго. Чтобы избежать этого и освободить время специалистов компании, занимающихся сверкой документации, было решено разработать свою OCR-систему на основе решений внешних поставщиков. Технология OCR (optical character recognition, оптическое распознавание символов) позволяет извлекать текстовые слои из отсканированных документов для сверки и переводить их в удобные для работы форматы.

habr.com/ru/companies/fix_pric

#ocrтехнологии #ocr #нейросети #искусственный_интеллект #документация

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst