Optical Character Recognition (OCR)


Оптическое распознавание знаков. Первоначально  использовалось только для специальных стилизованных шрифтов (OCR-A, OCR-B). В  настоящее время эта технология может использоваться для распознавания практически  всех латинских и многих нелатинских шрифтов. Это — способ оптического распознавания  знаков, поддерживаемый программным обеспечением, причем это программное обеспечение  различает просканированный текст лишь как пиксельную графику и из формы пиксельного  знака интерпретирует соответствующий знак ASCII (cм). В настоящее время программами  OCR используются обычно 3 метода, комбинируемые один с другим: контурный анализ,  усовершенствованное сравнение образцов знаков и лингвистический анализ. При контурном  анализе каждый знак описывается специфическими размерами знаков или отношением  длин их отдельных составных частей. Благодаря этому способу распознавание становится  менее зависимым от вида шрифта и величины знака. Некоторые программы дополняются  контурным анализом, так называемой технологией SAT (Self Assertion Technology).  Это — усовершенствованное сравнение образцов знаков, которое проводится без больших  библиотек знаков. При этом изображение сравнивается дважды: на первом этапе большинство  знаков распознается, а во втором — более сложные знаки сравниваются с абсолютно  распознанными эталонными знаками на первом этапе. При требованиях еще большей  точности сравнение повторяется снова. При лингвистическом анализе добавляются  национальные языковые особенности и словари. Они могут быть вызваны во время заключительной  обработки для того, чтобы можно было бы рассмотреть альтернативные предложения  для ненадежных слов. Для распознавания в большинстве случаев может быть вызван  лишь один словарь, в то время как для заключительной обработки может быть осуществлен  выбор между несколькими стандартными словарями и словарями пользователя. Тот,  кто часто хочет обрабатывать иноязычные шрифты, должен выбирать программное обеспечение  со многими языковыми опциями. К современным программам OCR относятся Recognita  Plus 4.0, Omnipage Pro 9.0, Readiris Pro 5.0.

В контексте:




 
Главные новости от RuPrint.Ru (пример)



Любое использование материалов портала RuPrint.Ru допускается только с письменного разрешения правообладателя.
Автоматизированное извлечение информации запрещено. Правила использования.

Рейтинг@Mail.ru