Технологии распознавания ABBYY доступны и для Linux-разработчиков

Компания ABBYY выпустила ABBYY FineReader Engine 9.0 for Linux, новую версию инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей.

Созданный на базе новейших технологий, SDK сочетает в себе традиционную для ABBYY точность распознавания, надёжность и широкий набор возможностей, среди которых улучшенная поддержка азиатских языков (CJK), технология ADRT для качественного восстановления внешнего вида и структуры документа, а также поддержка MRC-сжатия для форматов PDF и PDF/A.

«Рост популярности систем на базе Linux в крупных корпоративных структурах повышает активность разработчиков, занятых созданием программного обеспечения для этой операционной системы, отмечает руководитель отдела корпоративных проектов ABBYY Украина Михаил Бейрак. — Именно для таких разработчиков в первую очередь и предназначен наш новый инструментарий. ABBYY FineReader Engine 9.0 for Linux отвечает требованиям исключительного качества и стабильности встраиваемых в эти системы технологий: он гарантирует надёжность, точность и высокую скорость распознавания различных типов документов».

ABBYY FineReader Engine 9.0 for Linux избавит разработчиков от дополнительных расходов и скрытых издержек, которые сопровождают использование технологий Open Source. Производителям больше не придётся сталкиваться с отсутствием обстоятельной документации, несистематичными обновлениями и низким качеством распознавания, которое может вызвать недовольство со стороны пользователей.

В отличие от Open Source OCR-решений, инструментарий ABBYY сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке) и постоянно обновляется. Разработанный на основе собственных технологий ABBYY, SDK прошёл тщательное тестирование и обеспечивает распознавание самого высокого качества.

Среди ключевых возможностей ABBYY FineReader Engine 9.0 for Linux:

Поддержка множества языков

Инструментарий поддерживает 198 языков распознавания, включая языки на базе кириллического и латинского алфавитов (в том числе европейские готические шрифты), а также такие сложные для распознавания языки, как корейский, японский, китайский,  вьетнамский, тайский и иврит. Кроме того, SDK распознаёт многоязычные документы, причём в одном и том же документе могут быть использованы языки различных видов письменности (например, китайский и немецкий, иврит и французский). Всё это позволяет использовать решение ABBYY в создании приложений для международного рынка.

Технология адаптивного распознавания документов (ADRT)

Запатентованная ABBYY технология ADRT позволяет обрабатывать документ как единое целое. Используя специальный алгоритм, система распознаёт такие элементы структуры, как колонтитулы, сноски, нумерация страниц и подписи. В результате использования этой технологии многостраничные документы обрабатываются более эффективно — повышается качество и скорость обработки данных, минимизируется время на сборку отдельных страниц в единый документ.

Точное распознавание штрихкодов

Решение ABBYY распознает более 15 видов одномерных и двумерных штрихкодов (включая PDF 417, Aztec, DataMatrix и QR Code) независимо от их положения на странице и ориентации.

Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием

SDK предоставляет широкий спектр возможностей для работы с PDF, таких как создание PDF-файлов с возможностью поиска и применением тегов, извлечение метаданных, сохранение гиперссылок и внутренних ссылок документа, поддержка различных средств безопасности. Продукт предлагает инновационную технологию MRC-сжатия (Mixed Raster Content) для форматов PDF и PDF/A, в результате которого визуальные характеристики файла не страдают. Таким образом, ABBYY FineReader Engine 9.0 for Linux — это идеальная технология для решения задач архивирования и хранения документов.

Поддержка множества форматов

Решение ABBYY поддерживает множество графических форматов: PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в следующих форматах: RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF.