|
1.2.7. Сканування для системи розпізнавання символів
Системи оптичного розпізнавання символів (Optical Character Recognition чи, OCR-системы) призначені для автоматичного введення документів в пам'ять
комп'ютера. За нікчемний по історичних мірках відрізок часу ці системи вийшли із стадії експериментальних випробувань і перетворилися на один з самих
квапних в комерційному відношенні клас програмних продуктів. Зараз OCR-системы успішно справляються з обробкою друкарських документів. Завдання розпізнавання рукописних символів вирішується тільки в декількох окремих випадках.
Розпізнавання символів - це складна проблема, яка вимагає для свого вирішення залучення новітніх методів дискретної математики і штучного інтелекту. Вона не вирішується простими переборнимі алгоритмами. Складність реалізації не стала непереборною перешкодою для розробників; на ринку програмних продуктів пропонується декілька систем автоматичного розпізнавання зразково рівного класу, що володіють схожими функціональними можливостями. За кордоном набули найбільшого поширення програми Omnipage, Presto!, OCR Pro. Непоганою функціональністю володіють системи Textbridge і Cuneiform. У наший країні найпопулярнішою є програма Finereader, розроблена фірмою ABBYY.
Finereader - це програма-поліглот, розробники ввели в її склад засоби розпізнавання текстів, написаних на найпоширеніших мовах миру. Вона майже не знає шрифтових обмежень, в середовищі програми можуть бути успішно оброблені тексти, набрані найрізноманітнішими шрифтовими гарнітурами.
Процедура обробки документів в будь-якій OCR-системе складається з наступних етапів:
- Сканування. На цьому етапі сканер формує зображення, яке є основою для подальшого розпізнавання. Цифрова версія документа є зображенням, яке не може бути відредаговане як текст жодним програмним засобом.
Інтенсивність прояву поліграфічного муару залежить від малюнка. Він особливо помітний в областях з однорідною заливкою. І навпаки, достаток дрібних деталей здатний повністю маскувати цей дефект від очей спостерігача. Так, на мал. 1.18 муар майже непомітний на зображенні гір і сніги, які містять безліч довільно розташованих фрагментів маленького розміру.
Більшість сучасних комп'ютерних моніторів використовують в своїй роботі електронно-променеві трубки і матриці рідких кристалів. Це регулярні структури, які при «сприятливих» обставинах можуть стати причиною появи муару на екрані. Інтенсивність екранного муару залежить від масштабу зображення. Залежно від встановленого коефіцієнта збільшення цей ефект може посилюватися або абсолютно зникати. Для зображення, яке призначене для публікації в мережі, муар - це абсолютно неприпустиме явище. Достовірний висновок про наявність цього артефакту і його силу можна зробити, тільки проглянувши картинку в її дійсному масштабі, тобто при 100 %-ном збільшенні.
Всі згадані настройки процесу сканування розташовані в одному діалогом вікні програми Finereader (див. мал. 1.15). Щоб вивести його на екран, слід виконати команду головного меню програми
Сервіс => Опції => Ськанірованіє/ Відкриття => Настройки сканера.

Мал. 1.15. Діалогове вікно з настройками сканера в програмі Finereader
Це
доступний інтерфейсний засіб, всі його елементи носять російські назви і мають дуже прості правила звернення. При скануванні сторінок в чорно-білому режимі результати розпізнавання дуже сильно залежать від вибраного значення яскравості. Її настройка виконується за допомогою повзунка, розташованого під чорно-білим градієнтом, або за допомогою введення числового значення
яскравості.
Від вибраного значення яскравості залежить процентне співвідношення між чорними і білими крапками, а отже, і щільність букв. Цей параметр є по суті справи порогом, від значення якого залежить тон крапок. Чим вище значення яскравості, тим більше число крапок отримує в результаті сканування білий колір. І навпаки, зниження яскравості вводить до складу документа більше чорних крапок, що робить символи темніше і щільніше.
Верхній напис, показаний на мал. 1.16, оброблений з високою яскравістю. Можна відмітити, що це привело до втрати зв'язності деяких букв. Обробка такого зразка може привести до появи неправильно розпізнаних символів. Середній варіант оцифрований при низьких значеннях яскравості, що привело
до захоплення безлічі паразитних фонових крапок. Розпізнавання такого зразка також може спричинити появу помилок, оскільки збільшення товщини символів привело до появи сполучених пар літер- лігатур. Нижній образец- це приклад зображення, оцифрованого з нормальною яскравістю. В результаті вдалого розподілу чорних і білих крапок досягнута висока щільність символів і збереження дрібних деталей. З іншого боку, всі літери добре отделіми від своїх сусідів і фону.

Мал. 1.16. Варіанти зображення, оцифровані з різною яскравістю. Від встановленої яскравості залежить щільність літер, яка вирішальним чином впливає на результативність розпізнавання
Слід зазначити, що неможливо задати оптимальний рівень яскравості умоглядно, для цього потрібно провести серію пробних сеансів оцифрування. Програми розпізнавання символів не пристосовані для такої роботи, тому вони не надають користувачеві зручних засобів підбору яскравості. Ця ситуація дає ще один вагомий аргумент на користь тези, яка автор не раз відстоював в цій книзі. Всю препроцесорну обробку зображень краще виконувати засобами спеціалізованого растрового редактора. Стосовно розпізнавання це означає, що документ слід сканувати в режимі Grayscale, потім відкрити його в Photoshop і в його середовищі провести всю необхідну підготовку для успішного розпізнавання.
Алгоритми роботи систем розпізнавання закриті від користувача, але всі програми цього класу демонструють декілька загальних особливостей поведінки. Ідеальним оригіналом для будь-якої програми розпізнавання є біла щільна сторіночка, що набрана рубаним шрифтом 12 кегля (наприклад, Arial або Prag-matica), не має графічних вставок, кольорового фону, забруднених фрагментів, маловживаних слів, фрагментів на іноземних мовах, позначок на полях, математичних і хімічних формул, перегинів і розривів
і при цьому набрана в одну колонку. Всі відхилення від цього ідеалу більшою чи меншою мірою ускладнюють роботу системи розпізнавання.
|