Оценка OCR на русских документах: поиск лучшего решения

Оценка OCR на русских документах: поиск лучшего решения

В статье представлены результаты тестирования различных OCR-решений на русскоязычных документах. Были протестированы такие решения, как DocsConvertor, datalab-to/marker, deepseek-ai/DeepSeek-OCR, Qwen/Qwen2.5-VL-7B-Instruct, datalab-to/chandra, deepseek-ai/DeepSeek-OCR-2 и Qwen/Qwen3-VL-8B-Instruct.

Тестирование проводилось на шести датасетах, включающих различные типы документов, такие как простые тексты, документы с таблицами и изображениями.

Оценка проводилась по нескольким метрикам, включая качество распознавания текста, точность распознавания таблиц и производительность.

Результаты показали, что ни одно из существующих OCR-решений не является универсальным и каждое имеет свои сильные и слабые стороны.

Рекомендуется выбирать решение в зависимости от конкретных требований к инфраструктуре, типу документов и критичным метрикам качества.

Читать оригинал