Софт-Портал

распознавание текста сканером

Рейтинг: 4.9/5.0 (211 проголосовавших)

Категория: Windows

Описание

Заказать в Москве услуги сканирования и распознавания текстов, документов, книг и журналов

Услуги распознавания документов, текстов, журналов и книг в Москве

Неотъемлемой частью бесперебойной работы любого офиса является документооборот. И часто поток договоров и других документов настолько высок, что у сотрудников компании нет времени на набор новых объемных текстов, необходимых в работе. Кроме того, случаются внештатные ситуации, когда текстовая информация может быть утеряна на компьютере, однако имеется в печатном виде. В этом случае быстрее и проще обратиться в сервис распознавания текста, нежели набирать его заново.
Компания «СканЦентр» предоставляет обширный спектр услуг по распознаванию текстов, документов, журналов и книг, включая сканирование и распознавание текста на широкоформатном оборудовании.
В нашем штате работают квалифицированные сотрудники, функции которых не ограничиваются лишь программным распознаванием и сохранением текста в формате *.doc, *.docx, *.txt, *.xls, *.pdf, *.djvu или *.jpeg, они также проверят его на наличие грамматических и орфографических ошибок. А если вы предоставляете текст на иностранном языке, тогда опытные лингвисты и переводчики «СканЦентра» поправят смысловые ошибки и неточности. Благодаря тщательной и грамотной работе сотрудников нашего сервиса, после сканирования и распознавания текста вы получите качественный документ, который можно отправлять по электронной почте, распечатывать, редактировать и т.д.
Кроме того, мы предлагаем услугу распознавания рукописного текста, которая будет весьма полезна авторам крупномасштабных художественных, информационных, исследовательских, научных и аналитических работ.

Преимущества сканирования и распознавания документов в «СканЦентре»

Понимая потребности наших клиентов, для которых приоритетными являются отличное качество и высокая скорость предоставления услуг, мы выполняем работу в точно оговоренные сроки. При этом неизменное качество распознавания документов обеспечивается за счет производительного, высокотехнологичного оборудования, современного программного обеспечения и слаженной работы сотрудников сервиса «СканЦентр».
На все услуги мы предлагаем лояльные тарифы, а при заказе больших объемов работы вы получите существенную скидку.

Цены на сканирование и распознавание Стоимость каждого заказа в нашем сервисе назначается по индивидуальной тарифной сетке, где цена распознавания сканированного текста зависит от следующих факторов:
  • объема работы (количества страниц);
  • языка, на котором он напечатан (проверка иностранных текстов требует дополнительных услуг переводчика).
Преимущества профессионального распознавания печатного текста перед программным

Сегодня многие интернет-ресурсы и фирмы, оперирующие специальным программным обеспечением, предлагают широкий набор утилит для автоматического распознавания русского текста, журналов, изображений, даже книг. Профессиональное ПО требует вложения серьезных средств и установки на свое компьютерное оборудование. Такой вариант вряд ли устроит предприятия, которые лишь время от времени прибегают к распознаванию отсканированного текста.
Кроме того, многие виртуальные сервисы предлагают воспользоваться данной услугой онлайн, которая не требует инсталляции ПО на свой компьютер. Но и этот вариант не подойдет, если речь идет о работе с объемными документами, ведь после распознавания все равно их необходимо проверять и корректировать вручную.
Всех вышеуказанных неудобств вы можете избежать, обратившись к услугам распознавания текстов профессионалами «СканЦентра». Ведь обработка отсканированных русских журналов, книг и договоров специалистами включает в себя последующую проверку текстов на грамотность.

Особенности распознавания изображений

На первый взгляд, самой простой задачей является распознавание текста сканером с печатного образца или заранее отсканированного изображения, сохраненного на внешний накопитель. Однако хочется отметить, что скорость приведения документа в необходимый заказчику вид во многом зависит от качества изображения. Если на исходном образце некачественно пропечатаны отдельные части текста или отдельные области печати не захвачены и утрачена целостность документа, нашим сотрудникам может понадобиться больше времени на его восстановление.
Несмотря на возможные трудности, сотрудники «СканЦентра» постараются в сжатые сроки выполнить ваш заказ и примут на распознавание книги, журналы и документы как в исходном виде, так и сохраненные на различных внешних носителях.

распознавание текста сканером:

  • Ссылка 1
  • Альтернативный сервер
  • Другие статьи, обзоры программ, новости

    Сканирование и распознавание текста - Скачать бесплатно программы, скачать софт бесплатно

    Программа для создания скриншотов ABBYY Screenshot Reader 9.0.0.1051


    Программа для создания скриншотов ABBYY Screenshot Reader 9.0.0.1051
    Если вам нужно сделать снимок вашего экрана, то программа для создания скриншотов ABBYY Screenshot Reader 9.0.0.1051 именно то, что вам нужно. Программа для создания скриншотов позволяет сохранять снимок всего экрана, отдельно выбранной области или снимок определенного окна программы. А дальше делайте с файлом все что угодно: отправляйте друзьям или распознавайте текст и редактируйте его.
    Язык интерфейса: русский
    Таблэтка: Присутствует

    Добавлено 12 февраля 2010 | в Текст » Сканирование и распознавание текста | Комментариев 0 | Просмотров 9946 | В закладки

    Программа для сканирования ABBYY FineReader Pro 10.0.102.95


    Программа для сканирования ABBYY FineReader Pro 10.0.102.95
    Вышла новая версия самой популярной и многофункциональной программы для сканирования и распознания текста ABBYY FineReader Pro 10.0.102.95. В ней используется новая, более четкая система распознания данных. На главной панели программы для сканирования вы сможете создать сценарий действий и при нажатии одной кнопочки вы получите редактируемый документ из бумажного носителя.
    Язык интерфейса: русский
    Таблэтка: Присутствует

    Добавлено 9 февраля 2010 | в Текст » Сканирование и распознавание текста | Комментариев 0 | Просмотров 111295 | В закладки

    Цель создания сайта - позволить пользователю скачать программы бесплатно для ознакомления с ними. Ведь многим сложно оценить программу просто по обложке. В тоже время многие скачать программу бесплатно чтобы просто сравнить её с аналогами. А для этого отлично подходит наш сайт. Пользователь заходит в тематический раздел и выбирает ряд программ для сравнения. После этого он скачивает её и оценивает. Кто-то это называется пиратством, а кто-то свободой выбора перед покупкой программы.

    Работа на персональном компьютере в среде Windows без применения мышки и без помощи глаз

    Урок 3: Программа распознавания текстов FineReader, версия 6.0. 2 Как устроен сканер

    Сканер - это оптико-механическое электронное устройство. Механизм сканера помещается в герметический корпус, стеклянный сверху. На это стекло кладётся сканируемый лист или книга в развороте. Под стеклом ездит очень яркая продольная лампа, освещающая сканируемый лист. Вместе с лампой перемещается узкое продольное зеркало. Это зеркало постоянно изменяет угол своего наклона так, чтобы проецировать освещённую полоску изображения на продольный фотосчитыватель, расположенный неподвижно на задней стенке сканера.

    Теперь становится понятным, что изображение считывается сканером в виде тонких ниточек. Каждая ниточка - это цепочка точек. Ниточки распознанных точек постоянно передаются сканером в компьютер. И уже драйвер сканера складывает из этих ниточек изображение и передаёт его запросившей программе в виде графического файла.

    Немного упрощённая модель бытового сканера, но зато всё должно стать понятным.

    Раньше сканеры подключались к компьютеру через LPT-порт. Но затем скорости этого порта стало не хватать, и сканеры начали подключать через более скоростной USB-порт.

    Сканирование одной страницы у хорошего сканера должно занимать до 20 секунд.

    После сканирования страницы лампа и зеркало сканера возвращаются на исходную позицию. Это называется обратным ходом сканера. Во время обратного хода можно переворачивать и менять страницы. Современный компьютер успевает за время обратного хода распознать отсканированную страницу.

    Крышку сканера при сканировании текста закрывать не обязательно.

    Параметры сканирования

    Сканер выдаёт нам картинку. Эта картинка состоит из набора цветных или чёрно-белых точек, для каждой из которых сканер распознаёт цвет.

    Плотность распознаваемых точек (то есть количество точек на единицу длины или площади) называется разрешающей способностью сканера или разрешением. Максимальная разрешающая способность ограничена оптическими возможностями сканера. Разрешение сканера можно регулировать программным путём. Уменьшение разрешения ускоряет работу сканера.

    Разрешающая способность измеряется количеством точек на дюйм и обозначается как "dpi". Например, для сканирования нормального текста достаточно установить разрешение в 300 dpi, что составляет примерно 12 точек на миллиметр. Разрешение монитора компьютера меньше 100 dpi. Очень хорошим разрешением для принтера является 600 dpi. Поэтому для бытовых потребностей большего разрешения сканера и не требуется.

    Сканирование может производиться в трёх режимах:
    • цветном,
    • сером,
    • чёрно-белом.

    Начнём с цветного режима, как естественного. В цветном режиме сканер определяет цвет для каждой точки. Сканер может различать несколько миллионов цветов или оттенков цветов. Значит, задача сканера - выдать для каждой точки число, которое определяет ее цвет среди миллионов оттенков цветов. Числа выходят большими. Поэтому и файлы цветных рисунков имеют большие размеры. И передача цветного изображения из сканера в компьютер происходит медленнее.

    Если нам не важен цвет изображения, то можно облегчить работу сканеру и компьютеру, задав сканирование в сером режиме. При этом сканер будет определять для каждой точки один из 256 оттенков серого цвета. Это все оттенки от абсолютно белого до абсолютно чёрного. При этом сканер выдаёт для каждой точки число от 0 до 255, что значительно меньше миллионов цветных оттенков. Размер серого графического файла на порядок меньше размера цветного файла.

    Но для сканирования текста нам и этого много. Нам нужно только отличать чёрные буквы от белой бумаги. Поэтому у сканера есть ещё третий режим сканирования. Это чёрно-белый режим. При чёрно-белом режиме для каждой точки определяется только два варианта цвета. Точка может быть или чёрной, или белой. Графический файл с чёрно-белым изображением тоже имеет на порядок меньший размер, чем файл с серым изображением.

    А как же быть с серыми точками?

    Сканер устанавливает условную границу серого цвета. Всё, что светлее этой границы, относится к белому цвету. А всё, что темнее, относится к чёрному цвету.

    А как сдвигать эту границу, чтобы в чёрный цвет не попали серые пятна на бумаге или чтобы в белый цвет не попали бледные буквы? Эта граница сдвигается при помощи яркости.

    Добавляя яркость, мы осветляем серую бумагу. Уменьшая яркость, мы зачерняем бледные буквы.

    А если наш текст напечатан бледными буквами на грязно-серой бумаге, то нужно переходить к серому режиму сканирования, иначе пятна бумаги наложатся на буквы и отличить их станет невозможно.

    Зачем нужна программа распознавания текста

    Познакомившись со сканером и процессом сканирования, мы понимаем, что сканер можно сравнить с фотоаппаратом. Он выдаёт нам фотографию страницы текста. Это набор очень большого количества цветных или чёрно-белых точек.

    А как же выделить текст из этих сотен тысяч и миллионов точек?

    Для этого служат очень большие и сложные программы распознавания текста. Проводя сложный и трудоёмкий процесс анализа графического файла, программа распознавания текста отделяет и распознаёт символы или относит скопления точек к разряду рисунков.

    На сегодняшний день лучшей в мире программой распознавания текстов является московская программа FineReader, которую мы и будем изучать.

    Как правильно класть документ в сканер

    Установите сканер возле себя на столе так, чтобы крышку вы открывали от себя, а шнуры подключения питания и соединения с компьютером входили в заднюю стенку сканера.

    Документ закладывается текстом вниз, по направлению к стеклу сканера. В одних сканерах (чаще) документ ориентируется так, чтобы верхняя часть текста страницы была направлена на Вас (книжная ориентация ) или верхняя часть разворота книги была слева (альбомная ориентация ). В других сканерах наоборот: верхняя часть текста должна быть направлена к задней стенке сканера (книжная ориентация) или к правой стенке сканера (альбомная ориентация).

    Общее правило такое. Верхняя часть текста должна находиться там, откуда стартует лампа сканера. Это будет правильная книжная ориентация. При книжной ориентации лампа сканера проходит текст сверху вниз. А правильная альбомная ориентация текста получается поворотом на 90 градусов по часовой стрелке. То есть, при альбомной ориентации лампа сканера должна проходить по тексту справа налево или против направления чтения.

    Если лист положен правильно, тогда можно отключить автоматическое определение ориентации страницы, что ускорит распознавание текста.

    Сканирование и распознавание

    FineReader содержит в своём меню различные команды для сканирования и распознавания текста. Простейшая из команд - "Сканировать и распознать" из меню "Процесс". По этой команде будет отсканирована и тут же распознана одна страница текста. После завершения распознавания вновь распознанный текст появится в окне "Текст". Курсор будет установлен на начало распознанного текста. Джоз обычно реагирует на это произнесением слова "Текст". После этого распознанный текст можно читать и править, как в обычном редакторе текстов.

    Если Вы сканируете целую книгу, то удобно сначала отсканировать все страницы, а потом их распознать. Для этого нужно воспользоваться командой "Сканировать несколько страниц" из меню "Файл", а затем - командой "Распознать все" из меню "Процесс". Поначалу советую Вам устанавливать в настройках сканера флажок "Останавливаться между страницами". Тогда сканирование новой страницы не начнётся, пока Вы не нажмёте "Enter" в ответ на запрос программы. Зато Вы всегда будете успевать переворачивать страницы.

    Перед сканированием книги не забудьте установить в настройках сканера признак альбомной ориентации изображения. А перед распознаванием не забудьте проверить язык распознавания текста в опциях FineReader.

    Перечислим основные команды сканирования и распознавания.

    "Control+d" - отсканировать и распознать одну страницу или разворот книги (меню "Процесс")

    "Control+k" - сканировать одну страницу (меню "Файл").

    "Control+Shift+k" - сканировать много страниц (меню "Файл").

    "Control+T" - остановить сканирование (меню "Файл").

    "Control+r" - распознать одну страницу (меню "Процесс").

    "Control+Shift+r" - распознать все страницы (меню "Процесс").

    "Сканировать и распознать несколько страниц" - команда из меню "Процесс".

    "Control+Shift+s" - вызов диалога Настройки сканера (в меню "Сервис" пункт "Настройки сканера").

    Если Вы сканируете разворот книги (альбомная ориентация текста), то можно установить опцию "Делить Разворот Книги" на вкладке "Сканирование" диалога "Опции". Это приведёт к тому, что после сканирования FineReader разделит два листа разворота на два разных файла и будет распознавать их отдельно. Такой метод улучшит качество распознавания и уменьшит количество ошибок. При сканировании отдельных страниц эту опцию можно убрать.

    Однако, FineReader может не понять, что перед ним разворот книги и оставить этот разворот как страницу текста в две колонки.

    А бывает и ещё хуже. Если текст идёт во много колонок, FineReader может разделить разворот не посредине, а в другом месте. И тогда Вы получите полстраницы и полторы страницы текста и гарантировано неправильное распознавание. Поэтому будьте осторожны с переключателем "Делить Разворот Книги". Применяйте его только к качественному тексту в хорошо разворачивающейся книге.

    На месте разворота обычно происходит изгиб бумаги. Место изгиба после сканирования выглядит как тёмная полоса. Если в изгиб попадают буквы, то в этом месте изображение строки изгибается, а сами буквы искажаются. Ещё буквы могут попадать как бы в серую тень изгиба, частично или полностью теряясь. Многочисленные ошибки в концах или в начале строк говорят о том, что книгу нужно сильнее прижать на развороте, чтобы уменьшить изгиб.

    Если книгу не удаётся достаточно хорошо развернуть, перейдите на серый режим сканирования. Это уменьшит влияние тени изгиба на крайние буквы и улучшит распознавание.

    При сканировании разворота книги в диалоге "Настройки Сканера" необходимо установить "Альбомную Ориентацию Изображения", а при сканировании одной обычной страницы текста - "Книжную ориентацию".

    Текст нормального размера и качества печати можно сканировать при "Ручном подборе яркости" 50%. В "Режиме сканирования картинок" нужно установить "Чёрно-белое изображение" при "Разрешении" 300. Это самый быстрый режим сканирования.

    Если буквы мелкие, увеличьте Разрешение до 400, 500 или 600.

    Если качество печати плохое или книга совсем плохо разворачивается, перейдите к "Автоматическому Подбору Яркости" и в "Режиме Сканирования Картинок" установите "Серый". Это замедлит сканирование, но улучшит качество распознавания.

    Все эти параметры устанавливаются в диалоге "Настройки Сканера" ("Control+Shift+s").

    Если на листе встречаются серые пятна или из-за тонкой бумаги и жирного чёрного текста проступают буквы и рисунки с обратной стороны страницы, увеличивайте яркость сканирования, например, до 60 или до 70. Это приведёт к исчезновению пятен и проступающих с обратной стороны страницы букв и рисунков.

    Если буквы слишком бледные, то уменьшите яркость сканирования, например, до 40. Это приведёт к тому, что буквы станут более чёткими и жирными, и их легче будет распознавать.

    Если текст на листе расположен в несколько колонок, как в журнале или газете, то на вкладке "Сканирование" диалога "Опции" переключатель "Тип Страницы" необходимо установить в положение "Авто". А если это обычный книжный текст, то лучше поставить переключатель "Тип Текста" в значение "Одна Колонка", что ускорит распознавание. Для верности лучше всегда держать этот переключатель в режиме "Авто".

    Замечание. Если выставлен признак "Делить Разворот Книги", то книгу можно распознавать, установив переключатель "Тип текста" в значение "Одна колонка". Если же признак "Делить разворот книги" не выставлен, то обе страницы книги распознаются как один лист текста. То есть, получается текст, набранный в две колонки. Поэтому в таком случае необходимо установить переключатель "Тип текста" в положение "Авто", чтобы текст распознавался как состоящий из нескольких колонок.

    Если нужно повторно отсканировать некоторые страницы, то установите на вкладке "Сканирование" диалога "Опции" признак "Запрашивать номер страницы перед добавлением в пакет". Это даст Вам возможность привести номер отсканированной страницы в пакете FineReader в соответствии с номером страницы в книге. Затем эту опцию можно будет отменить, так как дальше страницы будут нумероваться по порядку и добавляться в конец пакета.

    Если текст распознаётся очень плохо или распознанный текст совсем нечитабелен, первым делом проверьте ориентацию страницы, то есть, правильно ли закладывается страница в сканер. Дальше проверьте на вкладке "Распознавание" диалога "Опции" самый первый параметр "Язык распознавания". Неправильно выбранный язык может привести к огромному количеству ошибок. Не ставьте "Русско-английский" язык распознавания, если в тексте нет английских букв, чтобы русские буквы не заменялись аналогичными по написанию английскими. И только после проверки языка распознавания увеличивайте разрешение сканирования и переходите к серому режиму сканирования.

    Что такое Пакет

    "Control+n" - создать новый пакет (меню "Файл").

    "Control+p" - открыть существующий пакет (меню "Файл").

    Когда Вы начинаете сканировать новую книгу, нужно создать для этого новый пакет. Это папка, в которую будут помещаться все файлы: отсканированные изображения, распознанные тексты и так далее.

    Диалог создания и открытия пакета похож на диалог открытия и сохранения файла в Windows. Создание для каждой книги отдельного пакета гарантирует, что страницы разных книг не будут перемешиваться между собой. Продумайте имена для пакетов, чтобы Вам было в дальнейшем легко находить их.

    "Alt+1" - перейти в окно "Пакет" со списком отсканированных страниц.

    "Курсорные клавиши" - передвижение по списку отсканированных страниц в окне "Пакет".

    "Control+a" - выделить все отсканированные страницы.

    "Shift+курсорные стрелки" - выделение идущих подряд отсканированных страниц.

    Выделенные страницы можно распознавать, удалять или перенумеровывать.

    Например, Вы отсканировали страницы книги с 20 по 50, а в пакете они имеют номера от 1 до 31. Тогда нужно перейти в окно "Пакет" ("Alt+1"), выделить все страницы пакета ("Control+a") и задать номер первой странице равным 20 (команда "Перенумеровать страницы" из меню "Пакет").

    Находясь в окне "Пакет" (на какой-то из отсканированных страниц) и нажав "Enter ", Вы откроете окно "Текст", в котором находится распознанный текст этой страницы. Иначе в окне "Текст" будет текст просматривавшейся Вами ранее страницы.

    "Любая цифра" - перейти к странице, номер которой начинается с этой цифры.

    "Control+g" - перейти к распознанному тексту страницы с определённым номером.

    "Control+f4" - закрыть все остальные окна и перейти в окно "Пакет".

    Вычитка текста

    Из четырёх больших окон FineReader нас интересуют только два: окно со списком отсканированных страниц (окно "Пакет") и окно с распознанным текстом (окно "Текст").

    "Alt+3" - перейти в окно "Текст".

    Здесь Вы можете работать, как в любом редакторе текстов. Можно выделять, удалять, копировать, вставлять текст. То есть, распознанный после сканирования текст можно править ещё до сохранения. Причём, Ваши исправления не пропадут, если Вы даже закроете FineReader, не сохранив исправленный текст в файл. Откорректированный Вами распознанный текст сохранится во внутренних файлах пакета. Только если Вы повторите распознавание страницы, распознанный текст изменится.

    Обычно ошибки распознавания встречаются в местах с неуверенно распознанным текстом. Поэтому можно уделить основное внимание именно этим местам.

    "F4" - перейти к следующему месту с неуверенно распознанным текстом.

    "Shift+F4" - перейти к предыдущему месту с неуверенно распознанным текстом.

    Сохранение текста

    "Control+F2" - вызов диалога сохранения текста в файл (меню "Файл").

    Диалог сохранения распознанного текста похож на диалог сохранения файла в Word. При открытии окна диалога курсор находится в поле имени файла. Задав имя файла, переходим при помощи табуляции к окну "Тип файла", где выбираем тип файла для сохраняемого текста.

    Затем доходим при помощи табуляции до кнопки "Форматы". По пути можно проверить и изменить некоторые настройки. Если кнопка "Форматы" не нажимается клавишей "Enter", нажимаем её при помощи пробела. В крайнем случае применяем JAWS-курсор или курсор мышки. Делаем это так:

    "Insert+минус на серой клавиатуре" - перемещаем курсор мышки на кнопку "Форматы".

    "Разделить на серой клавиатуре" - иммитируем нажатие левой кнопки мышки.

    Открывается диалог "Форматы".

    Если мы хотим сохранить текст в формате "TXT", то нужно зайти на вкладку "TXT" и обратить внимание на окошко "Кодовая Страница". Выбираем здесь пункт "DOS Russian (866)" для сохранения текста в ДОС-формате или "Windows Кириллическая (1251)" для сохранения текста в формате Windows .

    Дальше либо нажимаем "Enter ", чтобы сразу вернуться в диалог сохранения текста в файл, либо табулируем до кнопки "OK", устанавливая по пути в нужное состояние опции сохранения текста.

    Например, при сохранении текста в формате "TXT" обязательно должна быть установлена опция "Сохранять деление на строки", чтобы текст в дальнейшем можно было читать "Блокнотом" в Windows 98 или программой "Reader" в ДОС.

    Вернувшись в диалог сохранения текста, доходим при помощи табуляции до кнопки "Сохранить" и нажимаем её при помощи "Enter " или пробелом. Сохранённый таким образом текст можно будет в дальнейшем читать как в Windows при помощи Word, так и в ДОС при помощи чтеца Reader.

    Альтернативным способом сохранения является команда "Передать выбранные страницы в Word ". Эта команда находится в меню "Файл". В этом случае FineReader запустит редактор Word, передаст ему выделенные Вами ранее распознанные страницы, и работа с текстом далее будет вестись по правилам редактора Word.

    Настройка опций FineReader

    "Control+Shift+o" - вызов диалога Опции (меню "Сервис") .

    "Control+Tab" - переход на следующую вкладку диалога "Опции".

    "Tab" - переход к следующей опции на вкладке.

    "Shift+Tab" - переход к предыдущей опции на вкладке.

    "Пробел" - сброс или установка опции, на которой стоит курсор.

    "Стрелки Вверх и Вниз" - Выбор из группы радиокнопок. Затем нужно табуляцией идти дальше по вкладке.

    "F4","Стрелка Вниз" или "Alt+Стрелка Вниз" - выбор значений в комбобоксе. Затем нужно табуляцией идти дальше по вкладке.

    Замечание. Не забудьте после установки параметров нажать кнопку "OK" или "Закрыть", чтобы изменённые параметры сохранились.

    Поначалу самым главным будет переключатель "Язык распознавания" на вкладке "Распознавание".

    Если настройки сканера вдруг предстанут перед Вами в незнакомом английском виде, загляните на вкладку "Сканирование" и установите радиокнопку "Использовать интерфейс FineReader". Если Ваш сканер совместим с FineReader, то диалог его настройки будет представлен в знакомом стандартном виде. В противном случае Вам придётся работать с оригинальным англоязычным интерфейсом драйвера Вашего сканера.

    На вкладке "Общие" диалога "Опции" есть кнопки "Сохранить" и "Загрузить", которые позволяют сохранить установленные опции в виде файла или загрузить из файла сохранённые ранее опции.

    Система помощи FineReader

    "F1" - вызов справки (меню "Справка").

    FineReader обладает очень подробной и хорошо структурированной справочной системой.

    Диалог справки представляет собой два окна. В левом окне находится содержание, а в правом - сам текст справки. При запуске справки курсор находится в окне содержания.

    Развернём для начала окно диалога справки. Для этого нажмём "Alt+Пробел" и дойдём затем "Стрелкой Вниз" до команды "Развернуть".

    Идём вниз по содержанию до интересующей нас темы. Мы движемся по нулевому уровню содержания. Здесь расположены названия глав.

    Чтобы перейти на первый уровень оглавления, где расположены названия статей справки, нажимаем "Enter" или "Стрелку Вправо". JAWS озвучивает переход между уровнями оглавления, что очень удобно.

    "Enter" - загрузка в правое окно текста статьи справки, на названии которой стоит курсор в левом окне содержания .

    "F6" - перейти в правое окно с текстом статьи справки и прослушать её содержимое.

    "F6" - вернуться в окно оглавления.

    "Стрелка Влево" - Сворачивание развёрнутых ранее глав содержания справки.

    Технологии и средства сканирования и распознавания графических и текстовых печатных материалов

    Технологии и средства сканирования и распознавания графических и текстовых печатных материалов

    8. Аналитический обзор наиболее известных OCR

    8.1 Отбор значимых факторов

    8.2 Оцифровка факторов

    Список используемых источников

    В процессе своего развития человеческое общество прошло этапы проникновения в тайны материи, научилось управлять различными видами энергии и, наконец, вступило в эпоху информатизации.

    Информатизация - одна из наиболее ярких черт системы общественных отношений развитых стран. Она играет определяющую роль во всех сферах деятельности людей. При этом информация становится в современном обществе важнейшим фактором экономического роста.

    Информационные процессы (сбор, обмен, накопление, хранение, обработка и выдача информации) осуществляются на базе технических средств информатизации.

    До середины XIX в. когда доминирующими были процессы сбора и накопления информации, средства информатизации представляли собой перо, чернильницу и бумагу. На смену примитивным средствам информационной техники в конце XIX в. пришли механические: пишущая машинка, телефон, телеграф, что послужило базой для принципиальных изменений в технологии обработки информации. Лишь спустя много лет информационные процессы запоминания и передачи информации были дополнены процессами ее обработки. Это стало возможным с появлением во второй половине XX в. такой информационной техники, как электронные вычислительные машины (ЭВМ), положившие начало информационным технологиям (ИТ).

    Технологический прогресс является сегодня не только главным фактором обеспечения благосостояния нации, но и важнейшим условием процесса ее устойчивого развития. При этом приоритетное внимание должно быть уделено именно информационным технологиям, которые благодаря их особым свойствам катализатора будут активно содействовать технологическому прорыву страны не только в информационной сфере, но и во многих других не менее важных направлениях.

    ИТ базируются на следующих технических достижениях:

    - новые средства накопления информации на машиночитаемых носителях (магнитные ленты, кинофильмы, магнитные и лазерные диски и т.п.);

    - системы дистанционной передачи информации (локальные вычислительные сети (ЛВС), сети передачи данных, телефонная сеть, радиосвязь, спутниковая связь и др.);

    - автоматизированная обработка информации с помощью компьютера по заданным алгоритмам.

    Естественно, что информационные технологии строятся на сочетании аппаратных средств, программных средств и творческой мысли создателей, как этих средств, так и компьютерных технологий.

    Специалисты называют аппаратные средства компьютерной техники Hardware (скобяные товары или жесткая проволока), а программное обеспечение - Software (мягкая проволока). Сочетание «Hardware & Software», переводимое как «твердый и мягкий», - профессиональный термин. В России программы на профессиональном сленге иногда называют новым словом «софтвер», а компьютер и периферию - «железом». Приоритетность роли программных или аппаратных средств в информационных технологиях не подлежит обсуждению, поскольку без программного обеспечениялюбой самый совершенный компьютер представляет собой набор электронных плат.

    Компьютеры и оргтехника коренным образом изменили облик организаций, стиль их работы, обеспечилимобильность и эффективность деятельности. В настоящее время невозможно представить повседневную жизнь без информационных технологий, которые открыли новые возможности для развития производства, в том числе и проектирования.

    Громадное количество всевозможных компонентов компьютерных комплексов, предлагаемых на рынке, создаёт значительные проблемы в их правильном применении и интегрировании.

    Комплекс офисного оборудования должен быть не только технически современным, но и оптимальным по составу, чётко ориентированным на решение производственных задач и подкреплённым мощной сервисной поддержкой.

    Сканер (Scanner) -устройство ввода в ЭВМ информации в виде текстов, рисунков, слайдов, фотографий на плоских носителях, а также изображения объемных объектов небольших размеров. Сканер представляет собой периферийное устройство, основным элементом которого является фотодатчик, предназначенный для фиксирования количества отраженного света в каждой области оригинала.

    Метод, на котором основаны современные сканеры, заключается в последовательном, точка за точкой, фиксировании изображения и преобразовании его в электрический сигнал. Этот метод использовалсяпри передаче фотографических изображений по телеграфу еще в 1850 г. Первый черно-белый сканер был создан в 1863 г. а цветной - в 1937 г.

    Сканирование представляет собой цифровое кодирование изображения, заключающееся в преобразовании аналогового сигнала яркости в цифровую форму. Такое получение цифрового изображения оригинала для ввода в компьютер называют оцифровкой (Digitizing). В процессе оцифровки изображение разбивается на элементарные частицы - пиксели, каждому из которых соответствует определенный код яркости и цветового оттенка.

    1.1 Принцип деятельности и классификация сканеров

    Сканер как оптоэлектронный прибор включает следующие функциональные компоненты: датчик, содержащий источник света, оптическую систему, фотоприемник, механизм перемещения датчика (или оптической системы) относительно оригинала. Электронное устройство обеспечивает преобразование информации в цифровую форму.

    В процессе сканирования оригинал освещается источником света. Светлые области оригинала отражают больше света, чем темные.

    Отраженный (или преломленный) свет оптической системой направляется на фотоприемник, который преобразует интенсивность принимаемого света в соответствующее значение напряжения. Аналоговый сигнал преобразуется в цифровой для дальнейшей обработки с помощью ПК.

    Сканеры весьма разнообразны, и их можно классифицировать по целому ряду признаков. В основе классификации могут быть следующие признаки:

    способ формирования изображения (линейный, матричный);

    конструкция кинематического механизма (ручной, настольный, комбинированный);

    тип вводимого изображения (черно-белый, полутоновый, цветной);

    степень прозрачности оригинала (отражающий, прозрачный);

    аппаратный интерфейс (специализированный, стандартный);

    программный интерфейс (специализированный, TWAIN-совместимый).

    1.2 Фотодатчики, применяемые в сканерах

    В современных сканерах применяют фотодатчики двух типов: фотоэлектронные умножители - ФЭУ (РМТ - Photomulti Plier Tube) или приборы с зарядовой связью - ПЗС (ССО - Charge-Coupled Device).

    Фотоэлектронный умножитель изобретен советским инженером Л.А.Кубецким в 1930 г. ФЭУ, представляет собой электровакуумный прибор, внутри которого расположены электроды - катод, анод и диноды. Световой поток от обьекта сканирования вызывает эмиссию электронов из катода. В соответствии с законом фотоэффекта фототок эмиссии прямо пропорционален интенсивности падающего на него светового потока. Вылетающие из катода электроны под действием разности потенциалов между катодом и ближайшим к нему электродом - динодом притягиваются к последнему и выбивают с его поверхности вторичные электроны, число которых многократно превышает первичный электронный поток с катода. Это обеспечивается благодаря тому, что диноды выполнены из материалов, имеющих высокий коэффициент вторичной эмиссии, а между ними приложены потенциалы, обеспечивающие усиление вторичной эмиссии. В результате через сопротивление нагрузки в анодной цепи ФЭУ протекает усиленный ток. Коэффициент усиления фототока в ФЭУ достигает. Такое усиление достигается за счет подачи на ФЭУ напряжения от высоковольтного источника (в зависимости от количества динодов - от 500 до 1500 В), причем потенциалы распределяются между электродами равномерно с помощью делителя напряжения. ФЭУ обладает высокой чувствительностью (1 А/лм), а его спектральный диапазон, определяемый областью длин волн регистрируемого излучения, соответствует задачам сканирования, поскольку перекрывает видимый спектр световых волн.

    Прибор с зарядовой связью (ПЗС) - это твердотельный электронный фотоприемник, состоящий из множества миниатюрных фоточувствительных элементов, которые формируют электрический заряд, пропорциональный интенсивности падающего на них света, и конструктивно выполняются в виде матриц или линеек.

    Работу ПЗС впервые продемонстрировали В.Бойл и Дж.Смит в 1970 г. Принцип действия ПЗС основан на зависимости проводимости р-n-перехода полупроводникового диода от его освещенности.

    ПЗС представляет собой полупроводниковый кристалл (как правило, кремний), на поверхность которого нанесена прозрачная оксидная пленка, выполняющая функцию диэлектрика в микроскопических конденсаторах. Одной из обкладок такого конденсатора является поверхность самого кристалла, а другой - нанесенные на диэлектрик металлизированные электроды толщиной не более 0,6 мкм.

    К электродам в определенной последовательности подается низкое напряжение (5-10 В). Это приводит к тому, что под электродами образуется так называемые потенциальные ямы в виде скоплений электронов. Под воздействием света в результате внутреннего фотоэффекта появляются свободные электроны. Количество электронов, скапливающихся под чувствительной площадкой каждого электрода, пропорционально интенсивности светового потока, падающего на чувствительную площадку данного электрода. Электроны образуют зарядовый пакет. Если ПЗС выполнен в виде линейки, зарядовые пакеты передаются из одной потенциально ямы в соседнюю, достигая последней ячейки, откуда поступают на предварительный усилитель. ПЗС-линейка может содержать до нескольких тысяч фоточувствительных ячеек. Размер элементарной ячейки ПЗС определяет разрешающую способность сканера. Область спектральной чувствительности ПЗС расположена в видимой части спектра, причем наибольшая чувствительность наблюдается ближе к красной области.

    1.3 Типы сканеров

    В зависимости от способа перемещения фоточувствительного элемента сканера и носителя изображения относительно друг друга сканеры подразделяются на две основных группы - настольные (Desktop)и ручные (Hand-held).

    К числу настольных сканеров относятся планшетные (Flatbed), роликовые (Sheet-feed), барабанные (Drum) и проекционные (Overhead/Camera) сканеры.

    Планшетные сканеры, или сканеры плоскостного типа, используются для ввода графики и текста с носителей формата А4 или А3.

    В планшетных сканерах оригинал располагается на его рабочей поверхности неподвижно. Освещение оригинала производится стабилизированным по интенсивности источником, в качестве которого используются лампы с холодным катодом или флуоресцентные лампы. В качестве фотоприемника обычно используется ПЗС-линейки. Лампа, ПЗС и оптическая система, направляющая на ПЗС световой поток, отраженный от оригинала, находятся на одной каретке и с помощью шагового механизма перемещаются вдоль оригинала. В основном все планшетные сканеры рассчитаны на получение копии с одного оригинала, однако к некоторым моделям сканеров прилагаются дополнительные приспособления для последовательной подачи и сканирования нескольких оригиналов.

    При использовании в качестве оригиналов книг или сброшюрованных документов имеется возможность обеспечить их прижим к стеклянной поверхности сканера специальной крышкой на петлях.

    К преимуществам планшетных сканеров следует отнести простоту использования, возможность сканирования как плоских оригиналов в широком диапазоне размеров, так и небольших трехмерных объектов. При необходимости сканирования оригиналов нестандартного большого формата имеется возможность сканирования по частям с последующим объединением с помощью какого-либо графического редактора.

    Недостатками этого типа сканеров являются большая занимаемая площадь, сложность выравнивания оригинала с неровно размещенным на носителе изображением, невозможность сканирования прозрачных оригиналов.

    Однако при всем этом, планшетные сканеры - наиболее популярные устройства ввода текстовой и графической информации. Они обеспечиваютнеобходимое качество изображений, используемых как в деловой корреспонденции, так и в высокохудожественных изданиях.

    Роликовые сканеры осуществляют сканирование оригинала при его перемещении по специальным направляющим посредством роликового механизма подачи бумаги относительно неподвижных осветителя и ПЗС-линейки. Сканирование в роликовом сканере, как и в планшетном, производится в отраженном свете. Этот принцип заложен в конструкции многих факсимильных аппаратов. Сканеры, работающие в двух режимах - сканирования изображения и его факсимильной передачи, называют факс - сканерами (Fax Scanner).

    В отдельных моделях роликовых сканеров имеется устройство для подачи листов, которое позволяет сканировать в автоматическом режиме.

    Большинство роликовых сканеров офисного применения предназначены для работы с оригиналами формата А4. Однако существуют широкоформатные роликовые сканеры, обеспечивающие сканирование оригиналов форматов А1 и А0.

    Преимущества роликовых сканеров определяются их компактностью, удобством подключения и пользования, автоматической подачей листов оригинала, удовлетворительной скоростью сканирования и низкой стоимостью. В тоже время эти сканеры имеют ряд недостатков, связанных с невозможностью без специальных приспособлений осуществлять сканирование сброшюрованных документов, книг, а так же с опасностью повреждения оригинала.

    Барабанные сканеры позволяют получать изображения прозрачных или отражающих оригиналов с высокой степенью детализации.

    Прозрачный оригинал в барабанных сканерах закрепляется с помощью специальной ленты или масла на поверхности прозрачного цилиндра из органического стекла (барабана), который для обеспечения устойчивости укреплен на массивном основании. При вращении барабана с большой скоростью (от 300 до 1350 об/мин) фотоприемник считывает изображение с высокой точностью. В большинстве барабанных сканеров в качестве фотоприемника используется ФЭУ, который перемещается с помощью винтовой пары вдоль барабана. Для освещения оригинала применяется мощный стабилизированный по интенсивности излучения ксеноновый или галогены источник света. При сканировании отражающих оригиналов применяется источник света, расположенный вне барабана рядом с приемником излучения.

    За счет высокой скорости вращения барабана имеется возможность фокусировать на оригинале достаточно мощный поток света без риска повреждения оригинала. В связи с этим отличительной особенностью барабанных сканеров является возможность сканировать с высоким разрешением оригиналы, имеющие высокую оптическую плотность (печатные издания, художественные работы, слайды, диапозитивы, негативные пленки), как в отраженном, так и в проходящем свете.

    В отдельных моделях барабанных сканеров в качестве фотоприемника изображения используется набор ПЗС-линеек, неподвижно установленных на всю ширину барабана и построчно сканирующих оригинал в отраженном свете. В этих сканерах, как правило широкоформатных, барабан совершает только один оборот за все время сканирования. Сканеры, в которых реализована эта технология, выгодно отличаются от сканеров с ФЭУ, поскольку исключается необходимость решать проблему стабилизации конструктивных элементов, обусловленную высокой скоростью вращения барабана. Для гашения возникающих при этом вибраций применяются специальные амортизаторы, увеличивающие массу сканера до 250 кг и более.

    Барабанные сканеры позволяют сканировать прозрачные или отражающие оригиналы типа высокохудожественных работ в полиграфии и картографии. При этом автоматическая корректировка освещенности, настройка фокусного расстояния и высокая производительность достигаются за счет обработки изображения встроенным компьютером.

    Значительные габариты, необходимость предварительной подготовки обслуживающего персонала и высокая стоимость барабанных сканеров обусловливают ограничение их области применения профессиональной полиграфией и картографией.

    Проекционные сканеры работают по принципу фотографической камеры и конструктивно напоминают фотоувеличитель.

    Оригинал располагается на подставке под сканирующей головкой изображением вверх. Сканирующая головка, содержащая ПЗС-датчик и перемещающий его в фокальной плоскости линзы двигатель, закрепляется на вертикальном штативе и может перемещаться по стойке или по вертикальным направляющим. Перед началом сканирования камеру устанавливают в положение, соответствующее требуемому разрешению и размеру изображения. Точная настройка (фокусировка), определяющая разрешение сканирования, осуществляется специальной редуцирующей линзой. Обычно в проекционных сканерах внутренний источник освещения не используется. Освещение оригинала производится за счет естественного комнатного света. В некоторых моделях проекционных сканеров свет через линзу освещает оригинал, а отраженный свет фиксируется ПЗС-матрицей. Такая конструкция сканера позволяет избежать влияния внешних засветок и получить высокое качество сканируемых изображений.

    Особенностью проекционных сканеров является возможность сканирования трехмерных объектов. При этом конструкция сканеров обеспечивает переменное расширение сканирования: небольшие объекты можно сканировать с высоким разрешением; большие нестандартные объекты, изображения которых нельзя ввести с помощью других сканеров, также могут быть сканированы, хотя и с низким разрешением. Простота конструкции и удобство применения, невысокая стоимость и возможность комбинирования при сканировании плоских и небольших трехмерных объектов обусловливают достаточно широкое применение проекционных сканеров как средств ввода информации.

    Ручные сканеры применяются для сканирования малоформатных оригиналов или фрагментов большого изображения. Перемещение окна сканирования относительно оригинала производится за счет мускульнойсилы человека.

    В небольшом корпусе шириной обычно чуть более 10 см размещаются лишь датчик, линза и источник света. Ширина области сканирования в зависимости от модели устройства варьируется от 60 до 280 мм. Длина области сканирования ограничена лишь объемом доступной оперативной памяти компьютера. Устанавливаемая в компьютере карта интерфейса преобразует поступающую информацию в цифровую форму и передает ее для последующей обработки специальной программе. Принципы работы ручного и роликового сканеров во многом похожи.

    Отличительно особенностью ручного сканера является то, что он использует источник питания компьютера, к которому подключен. Как правило, ручные сканеры подключаются к параллельному порту компьютера без каких-либо адаптеров. Низкая цена ручных сканеров обусловлена простотой их конструкции.

    В некоторых моделях ручных сканеров предусматривается возможность сканирования больших изображений за несколько проходов, т.е. путем последовательного просмотра отдельных его областей. Объединение областей сканирования производится с помощью специального программного обеспечения, позволяющего упростить эту процедуру.

    Применение ручных сканеровкак устройств ввода изображений объясняется их компактностью и дешевизной, хотя для профессиональной работы они обычно не используются. Однако применение ручных сканеров для сканирования текста не всегда оправдано, поскольку разработанные специально для ручных сканеров программы допускают довольно много ошибок при распознавании по сравнению со своими аналогами, созданными для других сканеров.

    Многофункциональные сканеры - это комбинированные устройства, сочетающие в себе возможности сканеров различных типов, а также других технических средств информатизации, служащих для решения таких задач, как оптическое распознавание символов, архивирование, электронная почта и факсимильная связь.

    В комбинированных устройствах all-in-one в одном корпусе обычно объединены роликовый сканер, лазерный или струйный принтер, факс-модем. Эти устройства можно использовать в качестве факсимильного аппарата, принтера, сканера, копировального аппарата и внешнего модема для доступа к сети по линиям телефонной связи. Такое интегрирование является оптимальным решением для SOHO (Small Office/Home Office - небольшой офис/домашний офис), поскольку позволяет освободить площадь и сэкономить на приобретении компонентов в комплексе, которые по отдельности стоят дороже. Основные недостатки таких комбинированных систем - невысокое качество и сравнительно высокая стоимость копирования страницы.

    В некоторых моделях планшетных сканеров фирмы Agfa реализована технология Twin Plate - новый способ размещения прозрачных и непрозрачных оригиналов в одном устройстве. Прозрачные и отражающие оригиналы располагаются в разных плоскостях, освещаются различными источниками, но регистрация производится одним и тем же приемником изображения.

    1.4 Цветные сканеры

    Современные сканеры в основном предназначены для сканирования цветных оригиналов, но имеют режимы сканирования черно-белых и полутоновых изображений.

    Задача цветного сканера сводится к различению основных цветов: красного (Red), зеленого (Green) и синего (Blue) - RGB. Для этого применяются различные технологии.

    Например, в цветном сканере с одним источником света сканирование оригинала может осуществляться в три прохода с последовательным применением различных фильтров: красного (R), зеленого (G), синего (B), поочередно размещаемых между источником света и оригиналом. Сканируемое изображение освещается белым светом не непосредственно, а через вращающийся RGB - светофильтром. Для каждого из основных цветов последовательность операций практически не отличается от последовательности операций при сканировании полутонового изображения. Существенными недостатками данного метода являются увеличение времени сканирования в три раза и необходимость точного совмещения цветовых слоев, чтобы не допустить размывания отдельных деталей изображения.

    В сканерах другого типа используются три источника света: красный, зеленый, синий, действующие поочередно для кратковременного освещения оригинала. Сканирование при этом производится однократно, что позволяет избежать несовмещения цветов, но требует подбора источников света со стабильными характеристиками.

    В некоторых конструктивных решениях цветных сканеров используется один источник света, но сканирование цветных оригиналов осуществляется за один проход благодаря тому, что фотоприемник выполнен в виде фототранзисторов, размещенных в три линейки, а три цветных фильтра расположены перед ними так, что каждая линейка фототранзисторов освещается только своим цветом.

    Однако наибольшее распространение получили цветные сканеры, оборудованные системой,состоящей из трех независимых фотодатчиков для каждого цвета. Оригинал освещается белым светом, а отраженный оригиналом свет попадает на фотоприемники через систему специальных фильтров, которые и разделяют белый свет на три составляющие. Принцип работы таких фильтров основан на использовании явления дихроизма, заключающегося в изменении окраски кристаллов в проходящем белом свете в зависимости от положения их оптической оси. После прохождения системы фильтров, разделенные красный, зеленый и синий свет попадают каждый на свой фотоприемник, например ФЭУ. Путем последовательно выполняемых операций считывания тонового распределения по основным цветам получают информацию, необходимую для воспроизведения цветов изображения.

    1.5 Характеристики сканеров

    Разрешающая способность определяется плотностью расположения распознаваемых точек и выражается в точках на дюйм (dpi - dot per inch). Сканеры имеют два параметра разрешающей способности: оптическое разрешение и программное. Оптическое разрешение - показатель первичного сканирования. Программными методами можно в дальнейшем повысить разрешение. Например, оптическое разрешение сканера может быть 300х600 dpi, а программное - до 4800х4800 dpi. Оптическое разрешение имеет более важное значение для пользователя.

    Оптическое разрешение зависит от размера элемента ПЗС-датчика и характеризует плотность, с которой производится выборка информации в заданной области оригинала.

    Разрешение сканера имеет два показателя: по горизонтали и вертикали. Например, 600х300;600х600; 800х800. Однако чаще всего употребляют первое значение: 600, 800 dpi.

    Выбор разрешения при сканировании:

    100 точек на дюйм позволяет подготовить графическое изображение для WEB;

    200 точек на дюйм применяют для печати копии документа;

    300 точек на дюйм используется для фотографий;

    600 точек на дюйм дает высококачественное изображение.

    Увеличение значения разрешения приводит к увеличению занимаемого места на диске при сохранении отсканированного изображения.

    Область сканирования - максимальны размер оригинала для данного сканера.

    Метод сканирования определяет одно- или трехпроходный способ считывания информации в цветных сканерах.

    Скорость сканирования - количество страниц черно-белого оригинала, сканируемых в минуту с максимальным оптическим расширением сканера.

    Разрядность сканера измеряется в бит и определяет то количество информации,которое необходимо для оцифровки каждой точки изображения, а также количество цветов, которое способен распознать сканер. 24 бит соответствуют 16,7 миллионам цветов, а 30 бит - миллиарду. Несмотря на то, что человеческий глаз уже не в состоянии отличить 16-битный цвет от 24-битного, в новейших моделях сканера заявлена 48-битная разрядность.

    Совокупность характеристик модели сканера определяет его принадлежность к одному из трех классов, на которые условно можно подразделить все модели сканеров.

    Сканеры простых моделей используются для подготовки деловой документации, создания прайс-листов и рекламных объявлений, а также для подготовки электронных публикаций (WEB-страниц, графических баз данных). Обычно такие сканеры обеспечивают оптическое разрешение в диапазоне 300-600 dpi, передачу 256 оттенков серого цвета для полутоновых изображений.

    Сканеры промежуточного класса планшетного типа обладают оптическим разрешением 600-1800 dpi, высоким динамическим диапазоном, имеют возможность работы с прозрачными оригиналами и применяются в издательской деятельности.

    Сканеры высокого класса обеспечивают разрешение свыше 4000 dpi, используются при необходимости оцифровки большого объема информации с высоким качеством и производительностью.

    Лидером на российском рынке сканеров является Hewlett-Packard, однако недорогие модели Mustek Paragon, KYE также пользуются спросом. Для профессионального применения используют сканеры UMAX или Agfa.

    1.6 Аппаратный и программный интерфейс сканеров

    Сканеры с интерфейсом SCSI требуют установки в компьютер дополнительной платы SCSI-адаптера, которая поставляется в комплекте со сканером. Преимуществом интерфейса SCSI является обеспечение высокой скорости сканирования.

    К компьютерам, оснащенным USB-портом, лучше подключать сканер с USB-интерфейсом. Скорость при этом несколько уступает интерфейсу SCSI, однако простота подключения сканера искупает этот недостаток.

    Сканеры с интерфейсом параллельного порта подключаются к уже имеющемуся параллельному порту. Пропускная способность параллельного порта значительно меньше по сравнению с интерфейсом SCSI. Однако при этом нет необходимости устанавливать дополнительную плату.

    В комплект поставки сканера входит специальная программа - драйвер, предназначенная для управления процедурой сканирования и настройки основных параметров сканера. Ведущие производители аппаратных и программных средств - компании Aldus, Caere, Eastman Kodak, Hewlett-Packard и Logitech - объединили свои усилия для создания собственного формата драйвера TWAIN.

    TWAIN-драйвер - единственный международный стандарт, введенный в 1992 г. для унификации взаимодействия устройств для ввода изображений в компьютер с внешними приложениями.

    Стандарт TWAIN определяет порядок обмена данными между прикладной программой и драйвером сканера, что позволило решить проблему совместимости различных компьютерных платформ, сканеров различных моделей и форматов представления данных. С помощью TWAIN-совместимого сканера можно сканировать изображения из любой программы, например Photoshop, CorelDRAW, PageMaker, PhotoStyler и др.

    Для организации процесса сканирования помимо непосредственно сканера требуется одна из специальных программ оптического распознавания информации - OCR-система (Optical Character Recognition).

    Оптическое распознавание информации -- механическая или электронная конвертация изображений и символов, редактируемая на компьютере. Перевод осуществляется программным путём, после получения образа со сканера или другого источника (рис. 1).

    Рис. 1«Источники информации»

    Ввод информации с бумаги в компьютер является в настоящее время часто выполняемой задачей. До недавнего времени эта задача решалась исключительно путем кодирования с клавиатуры компьютера. Большинство документов, подлежащих обработке, представлены в оригиналах на бумажном носителе. Поэтому неотъемлемой частью любой системы автоматизации являются компьютерные системы, включающие программы сканирования и оптического распознавания образов. Задача распознавания состоит в том, чтобы преобразовать входное (отсканированное) изображение в текст из подвижных символов. Иными словами графическое изображение каждого входного символа заменяется обозначением этого символа, используемым в компьютере (т.е. кодом, понятным компьютерной системе).

    Системы оптического распознавания символов стали неотъемлемой частью интегрированных пакетов, поддерживающих ввод в компьютер, хранение и обработку бумажных и электронных документов. Система включает в свой состав сканер для ввода информации.

    Работа сканеров основана на принципах функционирования фотомножительных устройств:

    изображение, считываемое сканером, хранится в электронном виде;

    сканер не может отличать текст от рисунков и представляет их в виде отдельных

    графических фрагментов из черных и белых элементов.

    Если созданное сканером изображение содержит текст и рисунки, то при помощи OCR можно:

    отделить текст от рисунков;

    записать этот текст в формате файла текстового процессора.

    Программное обеспечение в современных системах OCR выполняет анализ форм букв и создание текстового файла, в который распознаваемый текст записывается посимвольно с последовательным формированием слов и предложений.

    2.1 История развития OCR-систем

    Попытки автоматического распознавания предпринимались, начиная с 30-х годов XX века, однако первый OCR-аппарат от американской компании Intelligent Machines Research Corporation появился только в 1952 году. Естественно, ни о каком искусственном интеллекте речь тогда не шла. Первые OCR-аппараты не имели ничего общего даже с компьютерной техникой. В них свет, отраженный от подсвеченного участка оригинала, проходил через сложную систему зеркал, причем некоторые из них были расположены на вращающихся дисках. В результате из общего потока поочередно выделялись узкие световые пучки, соответствующие небольшим участкам оригинала -- аналогам пикселей электронного изображения. Эти «квазипиксели» поступали на вход фотоэлектронного умножителя -- оптико-электронного преобразователя с большим коэффициентом усиления. Полученные сигналы обрабатывались электронной схемой. В ходе обработки устанавливалось, является подсвеченная точка оригинала белой или черной. На основе полученной информации OCR-аппарат воспроизводил образ подсвеченного знака.

    Возможности этих машин были ограничены рядом условий. Для сколько-нибудь уверенного распознавания требовались исключительно хорошее качество, высокая контрастность и отсутствие каких-либо повреждений оригиналов. Кроме того, распознавать можно было далеко не все надписи, а только набранные определенными шрифтами. Именно с этой целью в 60-х годах были разработаны и стандартизованы специальные шрифты -- OCR-A (в США) и OCR-B (в Европе).

    В 70-х годах компания Kurzweil Computer Products предприняла качественно новый шаг в развитии OCR, создав систему, способную учиться распознавать шрифты. Результаты обучения, продолжавшегося обычно несколько часов, записывались на диск, и система приобретала способность распознавать тексты, набранные выученным шрифтом. В то же время в отечественном Научно-исследовательском центре электронной и вычислительной техники (НИЦЭВТ CCCР) группой под руководством Александра Шамиса велись исследования по распознаванию «рукопечатных» (сделанных от руки печатными буквами) надписей. Впоследствии результаты деятельности группы неоднократно находили воплощение в программном коде.

    В 1986 году компания Calera Recognition Systems разработала систему, позволяющую работать с неизвестными ей шрифтами без предварительного многочасового обучения. Это была первая OCR-система, обладавшая искусственным интеллектом. Вместо применявшейся ранее методики посимвольного сравнения с шаблонами она действовала по методу обобщения, ныне более известному как принцип нейронной сети. Разработчики предоставили в распоряжение программы свыше 10 тыс. образцов начертания каждой буквы; обобщая их, система получала представление об основных закономерностях начертания знака, что и позволяло обходиться без длительного обучения. Впрочем, некоторое обучение требуется и современным OCR-программам. Например, иногда приходится проводить «ликбез» при распознавании редких и декоративных шрифтов.

    В конце прошлого века на практике был реализован новый подход к OCR с использованием нечеткой логики. Программа выдвигала не одну, а несколько гипотез относительно каждого символа, причем каждой из них присваивала рейтинг, отражающий степень уверенности в данной гипотезе. При обработке списков гипотез во внимание принимались различные обстоятельства, например наличие или отсутствие получающегося слова в словаре, при этом соответственно менялся рейтинг каждой гипотезы. В конечном счете, списки поступали в распоряжение так называемого эксперта -- алгоритма выбора, за которым и оставалось решающее слово. Как правило, в таких системах правильным считается символ, чья гипотеза набрала максимальный суммарный рейтинг.

    Следует отметить, что современные OCR-системы решают намного более сложные задачи, нежели их предшественницы. Простым распознаванием текста теперь никого не удивишь. Потребности пользователей возросли, и подлежащий распознаванию документ часто выглядит намного сложнее, чем белая страница с черным текстом -- иллюстрации, таблицы, колонтитулы, фоновые изображения и прочие элементы усложняют ее структуру. Для того чтобы корректно воспроизводить в электронном виде такие документы, все современные OCR-программы начинают распознавание именно с анализа структуры. Как правило, при этом выделяют несколько иерархически организованных логических уровней. Объект наивысшего уровня только один -- собственно страница, на следующей ступени иерархии располагаются таблица и текстовый блок, затем ячейка таблицы, абзац или картинка, за ними следует строка, потом слово или картинка внутри строки и, наконец, нижний уровень -- символ.

    Любой высокоуровневый объект может быть представлен как набор объектов более низкого уровня: буквы образуют слова, слова -- строки и т.д. Поэтому анализ всегда начинается в направлении сверху вниз. Программа делит страницу на объекты, их, в свою очередь, на объекты низших уровней и т.д. вплоть до символов. Когда символы выделены и распознаны, начинается обратный процесс -- сборка объектов высших уровней, которая завершается формированием целой страницы. Такая процедура называется многоуровневым анализом документа, или MDA (Мultilevel document Analysis).

    Таким образом, задача распознавания отдельного символа, над которой работали последние полвека множество специалистов, хотя и не имеет идеального решения, но близка к нему, а потому несколько отошла на задний план, став лишь одной из множества ступеней логической лестницы, ведущей пользователя от бумажной страницы к ее электронной копии.

    К наиболее важным аспектам работы систем распознавания пользователи относят следующие:

    точность распознавания -- 95%;

    точность сохранения оформления в документах для текстовых процессоров (в форматах MS Word, MS Excel, Word Pro, Word Perfect) -- 89%;

    точность сохранения оформления для последующей электронной публикации (в форматах PDF, HTML) -- 87%;

    работа с таблицами и многоколоночными текстами -- 87%;

    простота использования -- 85%;

    надежность работы -- 82%;

    удобный поиск ошибок и сверка с оригиналом -- 80%;

    работа с цветом (сохранение цветных картинок, цвета шрифта и фона) -- 63%;

    прямой экспорт в другие приложения -- 61%;

    многоязычное распознавание -- 25%.

    Экспорт в Web-форматы сочли необходимым параметром 87% пользователей. Таким образом, возможность выкладывания результатов распознавания в Интернет становится даже более приоритетной, чем такие важные требования к OCR и вообще к программным продуктам, как удобство и простота интерфейса и надежность работы. Похоже, что сетевой фактор становится все более актуальным даже в областях, непосредственно с Интернетом не связанных. В данном случае привязанность OCR к Сети во многом можно объяснить появлением в Интернете многочисленных библиотек самой разной тематической направленности, содержащих электронные копии документов и изданий.

    2.2 Типы пакетов OCR

    Первые пакеты оптического распознавания символов имели четкое разделение по типу.

    В последнее время наблюдается тенденция к объединению этих двух типов в одном пакете, что перекликается с попытками разработать принципиально новые алгоритмы распознавания.

    В случае обучаемых систем происходит поточечное сравнение оцифрованного символа с образцом в справочной таблице. Оно осуществляется путем наложения масок символов на символ из считанного документа и проверки на полное совпадение. Как только совпадение достигается, символ добавляется в файл. В процессе распознавания символа при наложении маски размеры шрифта документа и маски должны быть одинаковыми. Это означает, что необходимо иметь маски для каждого размера шрифта и что система оказывается более эффективной в случае однотипного текста. С учетом этих ограничений, при разрешающей способности сканера 300 dpi обеспечивается достаточная точность обработки для того ограниченного набора шрифтов, который система “знает”.

    Число известных системе шрифтов обычно невелико -- около десятка. Однако достоинство подобных систем в том, что они предоставляют пользователю возможность обучать их новым гарнитурам. Обучение -- довольно длительный процесс, а, кроме того, впоследствии при сравнении шрифтов возможна путаница, вызванная наличием у некоторых символов дополнительных графических элементов типа умляутов, трема и седилей.

    В случае интеллектуальной системы -- более мощном методе преобразования считанного документа в текстовый файл -- программа самостоятельно идентифицирует каждый оцифрованный символ. Здесь маска символа заменяется на его контур. Такой эталонный контур может быть использован для любых размеров шрифтов. Стандартная система, основанная на этом методе, может распознавать несколько тысяч шрифтов. Поскольку такие системы не пользуются фиксированными масками, не возникает проблем, связанных с совпадением одной маски с несколькими разными символами. Кроме определения символа по контуру система выполняет ряд перекрестных проверок полученного текста.

    Среди многих методов наиболее распространенными являются следующие два. Первый метод заключается в частотном анализе текста. Сравнивается частота появления символа в тексте с его частотой в языке оригинала. Второй метод позволяет обнаружить неправильное сочетание символов, исходя из правил орфографии. Очевидно, что для эффективной реализации этого необходимо настроить систему на конкретный язык, на котором написан документ.

    2.2.1 Обучаемые пакеты

    Обучаемые пакеты программ OCR составляли большинство первых разработок. Такие пакеты теоретически способны обучаться распознаванию любых символов любых гарнитур. Для обучения программы конкретной гарнитуре нужно отсканировать эталонное изображение с последующим обучением каждому конкретному символу. Это довольно длительная процедура, однако, если данная гарнитура будет затем регулярно использоваться, стоит потратить пару часов на обучение. Программы такого типа сравнивают каждый отдельный символ страницы с символами в справочных таблицах, созданных в процессе обучения, составляя при этом текстовый файл. Это означает, что можно улучшить работу такой программы, обучив ее всему набору символов используемых в документе гарнитур. Поскольку программа теперь будет знать форму каждого символа, уменьшается вероятность ошибки из-за минимальной работы по угадыванию формы.

    2.2.2 Интеллектуальные пакеты

    Интеллектуальные пакеты OCR не нуждаются в обучении и могут интерпретировать формы символов независимо от используемой гарнитуры. Работа этих программ производит большое впечатление: документ пропускается через сканер, результат обрабатывается интеллектуальной программой OCR с выдачей текстового файла. Для страницы формата А4 вся процедура занимает немногим более одной минуты. При высокой точности это значительно быстрее ручного ввода.

    Интеллектуальный пакет за одну минуту позволяет отсканировать и распознать текст объемом 1200 символов. При этом созданный текстовый файл содержит обычно не более двух неверных символов -- достоверность распознавания порядка 99.83%.

    Среди недостатков таких пакетов следует отметить следующее. Поскольку некоторые из них не могут обучаться чтению конкретных гарнитур, отсутствие надлежащей гибкости может не позволить им распознать гарнитуры необычного вида.

    Конечный результат работы пакета OCR независимо от его типа представляет собой файл формата ASCII (или ANSI), а в ряде случаев даже отформатированный файл для таких популярных текстовых процессоров, как Microsoft Word (рис. 2).

    Рис. 2 «Процесс получения файла»

    Новейшие программы позволяют сэкономить время, записывая текст нескольких последовательных страниц в один файл. Кроме того, использование сканера с механизмом автоматической подачи отдельных листов позволяет организовать непрерывный ввод многостраничного документа.

    Программа распознавания текста увеличивает удобство работы с информацией. Эта функция позволяет преобразовать текст на отсканированном изображении в удобные форматы текстовых редакторов (doc, pdf и.т.д.). Появляется возможность для модификации полученного текста, использования его в документах, в печати, а также использовать контекстный поиск.

    Современные средства Microsoft Office также предоставляют возможности сканирования. В этот пакет входит программа Microsoft Office Document Imaging. Ее составляют два компонента: Microsoft Office Document Scanning и Microsoft Office Document Imaging.

    Document Scanning - позволяет управлять сканированием документа с применением любого установленного сканера, а Document Imaging - позволяет производить просмотр результатов на экране, осуществлять перекомпоновку многостраничных документов, выделять и обрабатывать распознанный текст, отправлять документы по электронной почте.

    Программа AfterScan Lite предназначена для выполнения коррекции и исправления ошибок. В ее основе заложен опыт корректоров и уникальность алгоритмов. После того как текст распознан такими программами как: CuneiForm, OmniPage или FineReader, для его проверки можно запускать AfterScan. Эта программа проверяет буквы, слова и знаки препинания с высокой скоростью и точностью.

    SimpleOCR (ранее известная как Wocar) -средство оптического распознавания отсканированного текста. Эта программа совместима со всеми моделями сканеров, поддерживающих интерфейс TWAIN. SimpleOCR преобразует растровую картинку в стандартный вариант текста. Не смотря на то, что она не поддерживает кириллицу, эта программа имеет достоинства: бесплатность и простота интерфейса. SimpleOCR распознает текст форматов bmp, tiff, jpeg. Функциональные возможности позволяют извлекать из документа образцы изображений и шрифтов, удалять шумы из отсканированного варианта и производить пополнение интегрированных словарей.

    В настоящее время на рынке систем распознавания существует ряд разработок, ориентированных как на различные сферы деятельности пользователя, так и на разные платформы.

    * краткий обзор существующих систем оптического распознавания информации.

    FineReader - это система оптического распознавания текстов (OCR), которая преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т.е. в коды букв, «понятные» системе), разработанная российской компанией ABBYY Software House.

    23 июля 2009 года ABBYY представила специальную версию FineReader для операционной системы Mac OS X - ABBYY FineReader Express Edition for Mac. По словам генерального директора ABBYY Россия Григория Липича выход специальной версии FineReader для Mac OS X продиктован временем. К релизу данной версии Mac-сообщество в России насчитывало более полумиллиона частных и корпоративных пользователей.

    адаптивное распознавание многостраничных документов - документ анализируется как единое целое, автоматически определяются колонтитулы, нумерация страниц, шрифты, названия таблиц и рисунков;

    поддерживает распознавание текста на 184 языках и имеет встроенную проверку орфографии для 38 из них;

    интеграция с проводником Windows и с популярными офисными приложениями;

    работа со всеми распространенными моделями сканеров и МФУ, режимы работы с автоподатчиком сканера;

    инструменты для предварительной обработки изображений, в том числе для очистки изображения от мусора, устранения перекосов строк и другие;

    автоматическое определение языка документа, распознавание многоязычных документов;

    распознавание цифровых фотографий;

    в комплекте идет программа ABBYY Screenshot Reader, предназначенная для распознавания любой области экрана;

    использование сценариев обработки позволяет автоматизировать повторяющиеся операции;

    использование многопоточного распознавания, оптимизация под современные многоядерные процессоры;

    сохранение документов в большинстве распространенных форматах (RTF, DOC, XLS, ODTдр.);

    сохранение в DOCX и XLSX форматах, внедрённых в MS Office 2007, сохранение в PDF и PDF/A (Professional);

    поддержка XML Paper Specification (XPS)- открытого графического формата электронных документов на основе XML, разработанного Microsoft (Professional);

    создание пользовательских сценариев сканирования и распознавания текста (Professional)