Програми для розпізнавання тексту

Категорії статей: система ; 14.12.2011

Останнім часом більшість користувачів домашніх ПК все частіше користуються цифровими носіями інформації для зберігання тексту. Це ж стосується книг чи рефератів. Припустимо у вас є багато матеріалу для курсової/дипломної роботи, а часу на набір просто не вистачає (як варіант - просто лінь). В цьому випадку кращий вихід - придбати сканер. Але є проблема: після сканування тексту власне текстом-то він не стає, а стає простою картинкою. Як бути? В цьому випадку вам допоможуть спеціальні OCR-програми для розпізнавання тексту. Про них ця стаття.

Міні-рейтинг програм для тих, кому "забагато букв":

  • 1. FineReader
  • 2. CuneiForm
  • А тепер трохи детальніше про ці та деякі інші програми



    FineReader Програма для розпізнавання тексту  - FineReader - (110mb, trial) ця програма відома багатьом - особливо тим, у кого є сканер. Вона часто входить в комплект сканера при продажі як бонус, і, як виявляється, не даремно. FineReader (Shareware) на сьогодні вважається лідером, еталоном для розпізнавання тексту з графічних документів. Програма здатна проводити сканування документа на сканері, звертаючись до його драйвера (що вельми зручно - не потрібно відкривати безліч вікон). Крім того, FineReader здатний взаємодіяти із сканером за допомогою власних діалогових вікон, використовуючи стандартні системні TWAIN-драйвери. У властивостях програми можна вибрати декілька режимів сканування: True Color (24 біта), Grayscale (12 біт) і Black&White (чорно-білий). Ваш вибір залежатиме, швидше за все, від поставленого завдання. Оптимальним вибором для практично будь-якої ситуації буде режим Grayscale. Програма здатна обробляти відскановане зображення у вигляді таблиці, простого тексту і малюнка. При цьому FineReader розбиває сторінку на декілька окремих модулів, які розпізнаються самостійно. Процес розбиття можна коректувати, змінюючи параметри модулів. При розпізнаванні в опціях FineReader слід вказати мову для розпізнавання тексту. Програма здатна самостійно перевіряти орфографію і зберігати розпізнану інформацію у файли форматів doc, html, pdf, sxw та ін. Весь процес - від сканування і до розпізнавання - можна проводити самостійно вручну (для просунутих користувачів) і за допомогою майстра розпізнавання і перекладу в автоматичному режимі (для новачків). Що тут скажеш? Перед нами - лідер розпізнавання. сайт програми



    CuneiForm Програма для розпізнавання тексту  - CuneiForm (лінки на скачування ви можете побачити внизу сторінки). Отже, зустрічайте! Ось він, головний конкурент FineReader - пакет для розпізнавання текстової інформації CuneiForm (Shareware). Ця програма також часто входить в комплект при покупці сканера і дозволяє розпізнавати текстову інформацію. Вона перевершила FineReader за якістю розпізнавання рукописного тексту (CuneiForm використовується в багатьох відомствах США, в т.ч. у ФБР, Міністерстві оборони і так далі). Інтерфейс CuneiForm примушує полюбити себе практично з першого погляду (по простоті і наочності йому немає рівних). На додаток до відмінного оформлення програма радує частенько далеко не гіршою якістю розпізнавання тексту, чим той же FineReader. Проте огріхи в роботі все ж є: гірша система розбиття сторінки на компоненти для роздільного розпізнавання, нижча якість розпізнавання таблиць. Як і в попередній програмі, є можливість вибору ручного режиму для етапів сканування і розпізнавання, але можна це зробити за допомогою вельми просто майстра. CuneiForm дозволяє зберігати результати своєї роботи в більшість форматів, підтримуваних пакетом Microsoft Office і іншими програмами подібного призначення. сайт програми



    SIMPLEOCR Програма для розпізнавання тексту  - SIMPLEOCR - почнемо ми, мабуть, з невеликої безкоштовної розробки. Програма SIMPLEOCR здатна розпізнавати текст на англійській, французькій і голландській мовах. На жаль, підтримка кирилиці в її опціях досі не значиться, що зовсім не означає, що програма не стане у нагоді. Студенти, науковці - ось її контингент. Вони по гідності оцінять її абсолютну безкоштовність і простоту інтерфейсу. Програма здатна розпізнавати текст у форматах bmp, tiff, jpeg. При цьому вона спочатку робить конвертацію зображення в монохромний формат (чорно-білі тони), а потім відбувається безпосередньо розпізнавання тексту. Слід зазначити, що зі своїм завданням SIMPLEOCR справляється вельми непогано і часто може послужити заміною альтернативним shareware-продуктам. Результат роботи програми можна зберегти у файл формату rtf.



    Microsoft Office Document Imaging Програма для розпізнавання тексту  - Microsoft Office Document Imaging - ця програма (Shareware) включена розробниками Microsoft в склад всім відомого продукту Office ХР. Тому з придбанням даного пакету ви автоматично набуваєте і цієї утиліти. Microsoft Office Document Imaging - це полегшена версія програми Text Bridge фірми Scansoft. Програма має невитіюватий інтерфейс і досить проста в освоєнні і використанні. В порівнянні з вищеописаною утилітою Microsoft Office Document Imaging допускає значно менше помилок при розпізнаванні російськомовного тексту, але все таки не дотягує за якістю до знаменитого Fine Reader. Програма постійно норовить змінити форматування вихідного документа. Вона так само, як і інші, розбиває вихідний оригінал на блоки, але редагувати цей процес, на жаль, неможливо. Як вихідний формат графічного документа Microsoft Office Document Imaging розуміє лише tiff, хоча це не проблема - графіку завжди можна сконвертувати або просто перетягнути зображення у вікно програми. Але зберегти розпізнаний текст у вас навряд чи вийде - доведеться експортувати в Word. Якщо вважати програму частиною загального пакету, то всі ці недоліки можна визнати неістотними, та і розпізнавання тексту в Microsoft Office Document Imaging все ж на рівні. А враховуючи ціну на піратську продукцію, що завозиться в наші краї, ця програма - непогана альтернатива всюдисущим Fine Reader і CuneiForm, хоча за якістю роботи місцями і не дотягує до цих знаменитих "монстрів" розпізнавання. (дивіться також опис установки)



    Recognita | пошук Програма для розпізнавання тексту  - Recognita - це продукт угорських розробників (shareware). Тому і заточена програма явно під англійську мову і латинський шрифт. Проте при розпізнаванні також підтримується кирилиця. Процес розпізнавання російськомовної інформації програмою можна назвати задовільним, але ніяк не відмінним. Вищеописані утиліти з цим справляються куди як краще. Проте з англійським в Recognita проблем не виникає. Так само, як і її суперники, програма здатна робити розмітку сторінки, сканувати через драйвер сканера або за допомогою TWAIN-драйверів, зберігати результат розпізнавання у вигляді файлів з розширенням DOC, HTML, RTF. Як альтернатива Recognita може дуже згодитися простому користувачеві в нелегкій справі розпізнавання, але якщо ви професіонал - вибирайте що-небудь зручніше і серйозніше.



    Підсумок

    Ми розглянули декілька найбільш знаменитих програм для розпізнавання текстової інформації з графічних файлів. Найбільш універсальною, якісною і такою, що гнучко налаштовується на сьогодні, без сумніву, можна назвати програму Fine Reader. Другою би я поставив CuneiForm, а вже потім - всі інші, розглянуті вище. Проте це абсолютно не означає, що будь-яка з описаних розробок не зможе впоратися з розпізнаванням тексту і не має права на життя. Навпаки: одні з них сильні у розпізнаванні російськомовного чи українського тексту, інші - таблиць, треті мають простій і красивий інтерфейс. А тому - вибір, як завжди, за вами!

    •Редактировать

    Раніше Програми для створення презентацій: 10 найкращих програм | Пізніше Програми для скачування фільмів

    Коментарі (2) на публікацію “Програми для розпізнавання тексту”

    1. Intangle пише:

      Ще декілька років назад я користувався програмою-розпізнавачем FineReader. Саме їй надаю перевагу і зараз. Тому, что в неї найбільш довга історія розвитку та досвіду у розпізнаванні.

    2. admin пише:

      Ціла передача була про засновника ABBYY і автора FineReader. Досить цікаво було подивитися та послухати, ось посилання http://www.youtube.com/watch?v=hSjveD_L8PA

    Залишити коментар

    Передрук матеріалів без дозволу автора заборонено. безплатно скачати програми без регістрації, безкоштовно, софт для пк ad ноутбуки, компьютеры, мониторы Контакти