Оптическое распознавание знаков. Первоначально использовалось только для специальных стилизованных шрифтов (OCR-A, OCR-B). В настоящее время эта технология может использоваться для распознавания практически всех латинских и многих нелатинских шрифтов. Это — способ оптического распознавания знаков, поддерживаемый программным обеспечением, причем это программное обеспечение различает просканированный текст лишь как пиксельную графику и из формы пиксельного знака интерпретирует соответствующий знак ASCII (cм). В настоящее время программами OCR используются обычно 3 метода, комбинируемые один с другим: контурный анализ, усовершенствованное сравнение образцов знаков и лингвистический анализ. При контурном анализе каждый знак описывается специфическими размерами знаков или отношением длин их отдельных составных частей. Благодаря этому способу распознавание становится менее зависимым от вида шрифта и величины знака. Некоторые программы дополняются контурным анализом, так называемой технологией SAT (Self Assertion Technology). Это — усовершенствованное сравнение образцов знаков, которое проводится без больших библиотек знаков. При этом изображение сравнивается дважды: на первом этапе большинство знаков распознается, а во втором — более сложные знаки сравниваются с абсолютно распознанными эталонными знаками на первом этапе. При требованиях еще большей точности сравнение повторяется снова. При лингвистическом анализе добавляются национальные языковые особенности и словари. Они могут быть вызваны во время заключительной обработки для того, чтобы можно было бы рассмотреть альтернативные предложения для ненадежных слов. Для распознавания в большинстве случаев может быть вызван лишь один словарь, в то время как для заключительной обработки может быть осуществлен выбор между несколькими стандартными словарями и словарями пользователя. Тот, кто часто хочет обрабатывать иноязычные шрифты, должен выбирать программное обеспечение со многими языковыми опциями. К современным программам OCR относятся Recognita Plus 4.0, Omnipage Pro 9.0, Readiris Pro 5.0. |