#Unstract

2024-07-30

Пайплайны, разметка и версионирование — открытые решения для работы с неструктурированными данными

Подготовили подборку решений для анализа и обработки неструктурированных данных. Инструменты помогут с разметкой текста, построением соответствующих пайплайнов и версионированием масштабных сводов информации для машинного обучения и не только. Поговорим про Sycamore , Surya , OmniParse , Unstract и Oxen — каждый из этих инструментов имеет открытый исходный код. Кроме того, организации могут значительно сэкономить на управлении и эксплуатации неструктурированных данных за счет объектного облачного хранилища. Запустили

habr.com/ru/companies/mws/arti

#Sycamore #Surya #OmniParse #Oxen #Unstract #неструктурированные_данные #MWS

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst