Рейтинг@Mail.ru
Программы
Программа для распознавания документов FineReader
anton
03-12-2019 17:35
3 мин на чтение
48 views
0

Точные механизмы, позволяющие людям распознавать объекты, еще только предстоит понять, однако ученые уже хорошо знают три основных принципа – целостность, целенаправленность и адаптируемость (IPA). Эти принципы лежат в основе ABBYY FineReader OCR, позволяя воспроизвести естественное или похожее на человека распознавание документов.

Программа FineReader

Давайте посмотрим, как FineReader OCR распознает текст. Во-первых, анализируется структура изображения документа. Программа делит страницу на такие элементы, как блоки текстов, таблиц, изображений и т.д. Строки делятся на слова, а затем – на символы. После выделения символов программа сравнивает их с набором изображений шаблонов. Она выдвигает многочисленные гипотезы о том, что такое это за символ. Исходя из этих гипотез, программа анализирует различные варианты разделения строк на слова и слова на символы. Обработав огромное количество таких вероятностных гипотез, программа принимает окончательное решение, представляя вам распознанный текст.

Кроме того, ABBYY FineReader поддерживает словари на 48 языках. Это позволяет проводить вторичный анализ текстовых элементов на уровне слова. Благодаря поддержке словаря программа обеспечивает еще более точный анализ и распознавание документов и упрощает дальнейшую проверку результатов распознавания. Перейти по ссылке (русская версия), чтобы скачать программу FineReader.

Оптическое распознавание символов

Оптическое распознавание символов (OCR) – это технология, позволяющая преобразовывать различные типы документов, такие как отсканированные бумажные документы, файлы PDF или изображения, полученные с помощью цифровой камеры, в редактируемые и пригодные для поиска данные.

Представьте себе, что у вас есть бумажный документ – например, статья в журнале, брошюра или договор в формате PDF, который ваш партнер прислал вам по электронной почте. Очевидно, что сканера недостаточно, чтобы сделать эту информацию доступной для редактирования, скажем, в Microsoft Word. Все, что может сделать сканер, это создать изображение или снимок документа, представляющий собой не более чем коллекцию черно-белых или цветных точек, известных как растровое изображение. Для извлечения и перенаправления данных из отсканированных документов, изображений с камер или PDF-файлов только изображений требуется программа распознавания символов, выделяющая буквы на изображении, записывающая их словами, а затем – словами в предложения, что позволяет получить доступ и редактировать содержимое исходного документа.

Принципы оптического распознавания

Наиболее передовые оптические системы распознавания символов, такие как ABBYY FineReader OCR, сконцентрированы на естественном распознавании. В основе этой системы лежат три основополагающих принципа: целостность, целенаправленность и адаптируемость. Принцип целостности гласит, что наблюдаемый объект всегда должен рассматриваться как “единое целое”, состоящее из многих взаимосвязанных частей. Принцип целенаправленности предполагает, что любая интерпретация данных всегда должна служить той или иной цели. А принцип адаптируемости означает, что программа должна быть способна к самообучению.

Не обязательно быть специалистом по OCR, чтобы увидеть преимущества применения OCR, основанного на принципах IPA. Эти принципы наделяют программу максимальной гибкостью и интеллектом, приближая ее к человеческому признанию.

В результате многолетней исследовательской работы компания ABBYY смогла реализовать принципы IPA, описанные выше в технологиях OCR.

 

Поддержите проект

Друзья, сайт Netcloud каждый день развивается благодаря вашей поддержке. Мы планируем запустить новые рубрики статей, а также некоторые полезные сервисы. 

У вас есть возможность поддержать проект и внести любую сумму, которую посчитаете нужной.