#%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B4%D0%BE%D0%BA%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2

2025-10-23

Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

habr.com/ru/companies/tedotech

#автоматизация #обработка_документов #технологии #искуственный_интеллект

2025-10-22

Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом.В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами.Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

habr.com/ru/articles/959168/

#автоматизация #обработка_документов #искусственный_интеллект #технологии

2025-08-28

Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг» . При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний, автоматизировав в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM). Изначально мы рассматривали два подхода к реализации подобных проектов. Первый – предполагал классическую работу с гибкими описаниями документов, когда правила извлечения информации задаются человеком. Второй вариант – комбинированный, с использованием больших языковых моделей (LLM). Наш опыт показал, что последний подход как минимум в три раза экономичнее, при работе с неструктурированными документами. Он обеспечивает хорошую скорость и высокое качество извлечения данных (более 95% правильно извлеченных данных), что позволяет нашим заказчикам масштабировать обработку документов без роста операционных расходов. Узнать подробности

habr.com/ru/companies/contenta

#llm #llmмодели #обработка_документов #юридические_документы #yandexgpt #llama #nlp

2025-08-19

Эффективное использование LLM в командной строке

ИИ уже стал привычным инструментом в ИТ. Мы используем LLM‑модели через веб-интерфейсы, API в коде, плагины и отдельные приложения. Но существует ещё один удобный способ взаимодействия с ними — командная строка.

habr.com/ru/articles/938418/

#llm #unix #bash #commandline #cli #искусственный_интеллект #обработка_документов

2025-08-05

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

В прошлой статье мы говорили, что нашли быстрый и простой способ, как с помощью LLM вытаскивать данные из юридических документов и доверенностей. А сегодня расскажем, какой промт мы для этого использовали. Узнать подробности

habr.com/ru/companies/contenta

#обработка_документов #llm #ai #nlp #idp #автоматизация_документооборота #искусственный_интеллект

2025-07-31

СontentCapture+LLM: как мы ускорили работу с неструктурированными документами

В эпоху цифровой трансформации каждая минута работы с документами на вес золота. Юридические отделы, банки, госучреждения ежедневно обрабатывают сотни договоров, доверенностей и судебных приказов. Ручной ввод данных, поиск реквизитов и проверка сроков могут отнимать до 20 минут на документ — и это если сотрудник не отвлекся на кофе. В нашей линейке продуктов есть универсальная IDP-платформа ContentCapture . Она хорошо понимает структурированные документы, а вот при обработке неструктурированных данных раньше могли возникать сложности. Чтобы решить эту проблему, мы в новом релизе продукта настроили интеграцию с облачными большими языковыми моделями (LLM), такими как YandexGPT и GigaChat. Делимся подробностями и рассказываем, как оценивали качество работы LLM с разными типами документов.

habr.com/ru/companies/contenta

#contentcapture #llm #nlp #nlp_обработка_текста #обработка_документов

2025-05-29

Ускоряем проверку документов для клинических исследований за счёт пайплайна на базе YandexGPT 5 Pro

В мире ежегодно проводятся тысячи клинических исследований , а в России их количество может доходить до 900 в год. До внедрения в практику новые методы лечения, лекарства и медицинские изделия проходят множество испытаний под строгим контролем. Исследователям необходимо подтверждать безопасность и эффективность метода, а также соответствие самой процедуры испытаний научным стандартам и нормам этики. Эти процессы формализованы и требуют подтверждения официальными документами — но их нельзя свести к одному простому формату, особенно если дело касается этики. Поэтому только проверка пакета документации может занимать недели, а в современных условиях хочется, чтобы эта работа была менее длительной — чтобы пациенты быстрее получали доступ к новым методикам лечения. В 2025 году команда НМИЦ онкологии им. Н.Н. Петрова вместе с Центром технологий для общества Yandex Cloud и компанией Raft запустила приложение для быстрой обработки документов клинических исследований. Решение на базе большой языковой модели Яндекса помогает специалистам научного центра классифицировать документы, проверять их оформление и содержание по чек‑листу — и это позволяет сократить цикл согласования с нескольких месяцев до 5–10 дней.

habr.com/ru/companies/yandex_c

#genai #llm #yandexgpt #этический_анализ #клинические_исследования #обработка_документов #промтинг

2025-05-29

Ускоряем проверку документов для клинических исследований за счёт пайплайна на базе YandexGPT 5 Pro

В мире ежегодно проводятся тысячи клинических исследований , а в России их количество может доходить до 900 в год. До внедрения в практику новые методы лечения, лекарства и медицинские изделия проходят множество испытаний под строгим контролем. Исследователям необходимо подтверждать безопасность и эффективность метода, а также соответствие самой процедуры испытаний научным стандартам и нормам этики. Эти процессы формализованы и требуют подтверждения официальными документами — но их нельзя свести к одному простому формату, особенно если дело касается этики. Поэтому только проверка пакета документации может занимать недели, а в современных условиях хочется, чтобы эта работа была менее длительной — чтобы пациенты быстрее получали доступ к новым методикам лечения. В 2025 году команда НМИЦ онкологии им. Н.Н. Петрова вместе с Центром технологий для общества Yandex Cloud и компанией Raft запустила приложение для быстрой обработки документов клинических исследований. Решение на базе большой языковой модели Яндекса помогает специалистам научного центра классифицировать документы, проверять их оформление и содержание по чек‑листу — и это позволяет сократить цикл согласования с нескольких месяцев до 5–10 дней.

habr.com/ru/companies/yandex_c

#genai #llm #yandexgpt #этический_анализ #клинические_исследования #обработка_документов #промтинг

2024-06-17

Сравнение сервисов для анализа документов AWS Textract, Azure Document Intelligence и Ripper Service от Технологики

Бизнес все чаще и чаще предпочитают отдать искусственному интеллекту извлечение данных из документов: при таком подходе меньше ошибок и выше скорость обработки документов. И все чаще звучит вопрос — каким решением пользоваться и к какому подрядчику пойти за оказанием услуги? Поэтому мы сделали сравнительный обзор двух популярных решений от лидеров рынка по обработке документов — AWS Textract, Microsoft Azure Document Intelligence и собственного решения Ripper Service. Сравнивали решения по нескольким основаниям: по производительности, по результатам извлечения значений из форм, а также по стоимости. Надеемся, что данная статья будет полезна руководителям компаний, которые уже задумались о применении ИИ для массовой обработки документов.

habr.com/ru/articles/822331/

#aws #azure_ml #ocr #idp #обработка_документов #ии #машинное_обучение #textract #ripper_service #ai

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst