Success Story - rus

Распознавание сложных таблиц без границ на отсканированных документах

Мотивация запуска проекта заказчиком: необходимо преобразовать ряд документов с таблицами из изображения в электронный вид.

Описание исходной ситуации:
  • основные сложности при распознавании таблиц: восстановление исходной структуры таблицы и работа с невидимыми границами ячеек.
  • методы классического CV плохо работают для случая таблиц с невидимыми границами.

Цели проекта:
  • создание модуля для преобразования изображения таблицы в структурированный формат.

Решение MIL Team: модель сегментации ячеек таблицы с последующей постобработкой.

Для построения модели были использованы: датасет PubTabNet, краудсорсинг Я.Толока.

Результаты моделирования:
Модель на базе архитектуры Unet и сопутствующее окружение, позволяющее преобразовать скан таблицы в формат html.

Заказчик: ИСП РАН

Технологический стек: Python, PyTorch, opencv

Computer Vision Research Division