OCR. Распознавание текста

Рубрики: [Разное]  

OCRПрошло время, когда для того, чтобы получить электронный вариант вашего текста, приходилось нудно и изнурительно набирать информацию на клавиатуре. На сегодня самым простым решением для этого может послужить сканер. Достаточным будет положить нужный текст на сканер и, нажав одну кнопочку, получить подходящую электронную копию. Так как же работает OCR-система? На сколько сложным будет получить 100% распознавание текста?

Технологии оптических распознавателей, или OCR, позволяют переделывать разного типа документы, например, бумажный текст в файл PDF. Также вы сможете переносить книги, газеты и журналы в электронный вид, при этом хранить на компьютере или на переносном хранителе.

OCR-системы удобны и просты в использовании. Качественное распознавание текста можно получить всего 3-мя действиями:

1.    Вставьте документ в сканер;

2.    Нажмите кнопку «Сканировать» («Распознать»);

3.    Текст, после распознания, появится в окошке вашего компьютера в текстовом редакторе.

Зачастую случается так, что «под рукой» нет сканера, но есть фотоаппарат или мобильный телефон с камерой. В таком случае есть еще один вариант для распознавания текста:

•    Сфотографируйте требуемый вам документ или его часть;

•    Подключите фотоаппарат (телефон) к компьютеру;

•    Нажмите кнопку «Получить изображение и распознать»;

•    Также текст, который распознала программа, появится в окне редактора (MS Word).

Напомним, что распознание текста не требует ввода символов в текстовый редактор вашего компьютера, OCR-системы направлены на автоматическое распознание, не требующего вашего контроля. Они распознают как текст и его элементы (схемы и таблицы), так и фотоизображения. Изображение обрабатывает алгоритм программы, при этом, выделяя область текста, изображения или таблицы, отделяя от мусора и не нужных данных. После чего все символы сравниваются си словарем символов, который находит соответствие. По итогу вы получите требуемый текст.

На сегодня OCR представлены в виде сложных программных решений. Текст может быть искажен или загрязнен, а программа должна учесть подобные ситуации. Современные системы позволят вам получить копии печатных документов в электронном виде, с возможностью форматирования.

Файл, который вы получили, можно хранить на своем компьютере, отправлять по электронной почте и передавать через программы обмена мгновенными сообщениями. Распознавание текста является удобным и простым способом для того, чтобы получить версию документа в электронном виде.


Леонид Миров


Оставьте комментарий



««« »»»