АВТОМАТИЗАЦИЯ ОБРАБОТКИ ДОКУМЕНТОВ
Системы оптического распознавания информации
Технология распознавания
В практической деятельности часто встречаются ситуации, когда необходимо перевести в электронный вид документ, напечатанный на бумаге. В этом случае можно просто набрать документ на компьютере, что занимает довольно много времени, либо воспользоваться сканером - устройством, специально предназначенным для перевода документов в электронный вид. Для организации сканирования изображения помимо непосредственно сканера требуется одна из специальных программ систем оптического распознавания текста.
Системы оптического распознавания текста (Орtiсаl Сhагасtеr recognition - ОСR-системы) предназначены для автоматического ввода печатных документов в компьютер.
Современные программы распознавания текста не только ошибаются реже, чем живой человек, но и обеспечивают проверку орфографии, автоматическое форматирование текста и массу других дополнительных удобств.
Последние годы ведущие позиции на российском рынке «распознавалок» удерживают программы Fine Reader и СuneiForm. Несмотря на свои замысловатые названия, обе программы отечественного производства вполне хорошего качества. По своим возможностям и сервису они примерно равноценны.
Сложность машинного распознавания текстов заключается в том, что его невозможно построить по жесткому алгоритму хотя бы потому, что для написания одной и той же буквы существует множество вариантов написания. Значит, чтобы компьютер корректно прочитал символы, он должен их «осмыслить». Иными словами, для распознавания текста требуется моделирование рассуждений человека в подобной ситуации, а это принято обозначать термином «искусственный интеллект».
|
|
Исходя из принципа целостности, распознаваемое изображение рассматривается как единый объект, состоящий из частей, связанных между собой пространственными соотношениями. По принципу целенаправленности распознавание строится как процесс выдвижения и целенаправленной проверки гипотез об объекте, а принцип адаптивности подразумевает способность системы к самообучению.
Для выдвижения гипотез о том, что может представлять собой изображение, применяются так называемые признаковые классификаторы. Они используют ряд признаков, на основе которых программа вычисляет степень близости распознаваемого изображения и известных ей классов изображений, после чего выдает список подходящих классов, т. е. гипотезу о принадлежности объекта к тому или иному классу. Кроме того, признаковые классификаторы применяются также и для повышения точности распознавания изображений с дефектами.
|
|
Полученный набор классов последовательно проверяется структурным классификатором, анализирующим каждый символ. Скажем, если Fine Reader полагает, что на странице изображена буква «ф», он специально проверяет те признаки, которые должны быть именно у буквы «Ф», а не у какой-либо другой, сравнивая этот символ со структурным эталоном. Структурный эталон описывает символ как комбинацию структурных элементов (отрезок, дута, кольцо, точка), находящихся в определенных отношениях между собой. Процесс распознавания делится на этапы выделения структурных элементов в изображении и сопоставлении их с эталоном.
Если в окончательный список попало более одной гипотезы, они попарно сравниваются с помощью дифференциальных классификаторов. Если структурный классификатор при распознавании символов не может однозначно выбрать одну из двух букв с похожим написанием, то между этими конкурирующими гипотезами делается дифференциальный выбор. Например, есть две гипотезы: распознаваемый символ представляет собой строчную букву «твердый знак» или «мягкий знак». Чтобы сделать выбор, Fine Reader целенаправленно проанализирует левый верхний угол буквы, где имеется единственная отличительная деталь между этими буквами.
С завершением работы дифференциального классификатора заканчивается распознавание и начинается этап проверки итогового списка гипотез. Окончательная стадия распознавания осуществляется системой контекста - при наличии некоторого количества распознанных букв из слова программа, используя словарь, может «догадаться», что это за слово.
Базовые принципы целостности, целенаправленности и адаптации остаются неизменными от версии к версии программы Fine Reader, ведь именно они позволяют компьютеру приблизиться к логике мышления человека.
Дата добавления: 2018-04-15; просмотров: 284; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!