Софт-Портал

распознавание текста на фото

Рейтинг: 4.9/5.0 (345 проголосовавших)

Категория: Windows

Описание

Как работает программа распознавания текстов?

Как работает программа распознавания текстов?

Поговорим о том, как работает программа для распознавания текста с картинки. Я уверен в том, что каждый человек, хотя бы раз если не прибегал к ее помощи, то по крайней мере очень хотел это сделать. "Зачем это нужно?" - могут спросить некоторые. А все очень просто. Например, вам необходимо написать реферат, курсовую, доклад и тому подобное. В Интернете ничего подходящего вы не нашли, а в библиотеке есть книга, которая вам подходит. Поскольку текста очень много, представьте, сколько его придется перепечатывать. Вот тут вам и придет на помощь программа для распознавания текста с фото.

Сначала отсканируйте или сфотографируйте требуемые страницы. А теперь будем разбираться на примере софта, который называется CuneiForm, как из графических файлов получить текст. Почему именно эта программа распознавания текстов? Во-первых, она бесплатная. Во-вторых, имеет большую скорость работы, а также высокое качество распознавания текстов. Причем эта утилита знает двадцать различных языков, работает со смешанным англо-русским и может оперировать таблицами и рисунками. Стоить еще отметить простоту использования с интуитивно понятным интерфейсом.

Преимущества мы перечислили, теперь немного о недостатках. Поскольку данная программа распознавания текстов разрабатывалась русскими программистами, дизайн оставляет желать лучшего. Но на это можно закрыть глаза, ведь внешний вид неважен, главное, как выполняются поставленные задачи.

Итак, сперва загружайте и инсталлируйте этот софт. Когда установка завершится, запускайте приложение. Выбирайте изображение, с которого и будет происходить распознавание вашего текста. Выбрали? Отлично. Теперь задаем язык, на котором написан интересующий вас текст. После этого потребуется выбрать некоторые установки, но вы можете не обращать на них никакого внимания, поскольку они ничего принципиально не изменят.

Как только программа распознавания текстов завершит преобразование картинки в текст, вы увидите окно, в верхней части которого будет находиться текст с ошибками, в то время, как в нижней части будет располагаться исходный файл. Что поразительно, так это качество распознанного текста. Например, я отсканировал страницу в очень плохом состоянии, соответственно и качество исходного файла было не на высоте. Однако это приложение справилось со своей задачей просто великолепно. Практически все слова были распознаны правильно, при этом имелось всего несколько ошибок.

Утилита предложит вам три различных варианта дальнейшего ее действия. Первый – начать редактировать документ. Второй – сохранить на какой-либо носитель информации. Третий – экспортировать в Ворд или Эксель. Выбирайте тот, который вам нужен. Вот, в принципе, и все необходимые манипуляции. Все легко и понятно. Как видите, такая программа распознавания текстов способна облегчить жизнь многим людям: школьникам, студентам, учителям, редакторам, менеджерам и прочим. Используя ее, вы освобождаете себя от муторного набирания необходимого текста вручную. Это позволит сэкономить уйму времени.

распознавание текста на фото:

  • скачать
  • скачать
  • Другие статьи, обзоры программ, новости

    Тяжелый случай: Обработка (улучшение читаемости) снятого на мобильный телефон текста

    Тяжелый случай: Обработка (улучшение читаемости) снятого на мобильный телефон текста Сообщество – Как создать сообщество? Как вступить в сообщество?

    Re[rean]:
    Дело в том, что фотографировал не я, а мой отец в библиотеке, где нельзя переснимать, поэтому вопрос освещения отходил на второй план.
    А по поводу невозможности автоматически такое поправить - см. экшн L4m3r и статью Xuman. Все можно!

    Re[L4m3r]:
    Я знал, что все дело в профессионализме!
    Это то, что я искал. Лучшее решение! Спасибо!
    Полностью согласен, что для печати нужны оттенки.

    Re[Xuman]:
    Хорошая статья, спасибо. Результат весьма неплох и удовлетворяет обеим пунктам.

    Re[bc----]:
    Цель - подготовить фото для последующей печати. С распечатками уже будет работать отец - готовит методичку.

    Re[motoro]:
    Распознавание было запасным вариантом. Все же для него нужно больше времени, нежели обработка экшеном.

    Итак:
    Платиновая медаль присуждается L4m3rу!
    Золотая - Xumanу!

    P.S. К сообщению приложены 2 файла обработанные предложенными алгоритмами, сравните результат.

    Исправлено Мирослав Кравченко 10.06.2009 11:22:40

    Сообщество – Как создать сообщество? Как вступить в сообщество?

    Распознавание рукописного текста - Фото 17058-16

    Распознавание рукописного текста

    Системы распознавания и перевода текста >>

    Распознавание рукописного текста.

    Фото 16 из презентации «Системы распознавания и перевода текста» к урокам информатики на тему «Работа с текстом»

    Размеры: 550 х 825 пикселей, формат: png. Чтобы бесплатно скачать фотографию для урока информатики, щёлкните на изображении правой кнопкой мышки и нажмите «Сохранить изображение как. ». Для показа фотографий на уроках Вы также можете бесплатно скачать всю презентацию «Системы распознавания и перевода текста» со всеми фотографиями в zip-архиве. Размер архива - 3131 КБ.

    Работа с текстом

    краткое содержание других презентаций о работе с текстом

    «Гипертекст» - Страница 5. Страница 1. Гипертекст. Страница 3. Страница 10. Страница 8. Страница 4. Страница 7. Страница 12. Страница 2. Такие связи называются гиперсвязями (гиперссылками).

    «Системы распознавания и перевода текста» - Как работают программы-переводчики. Сегментация в данном случае состоит в наложении шаблона. Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Для обработки бланков предназначено специальное приложение FineReader Forms. Сегментация - выделение блоков на изображении.

    «Извлечение информации из текстов» - 9. 5. АвиКомп, 2000 – 2010 гг. Gate: примеры аннотаций. ИЗВЛЕЧЕНИЕ ТЕРМИНОВ и СВЯЗЕЙ. Сущность «Angela Merkel». Технология решения. Gate. шаблоны и правила. М.В. Ломоносова, Факультет ВМиК bolsh@cs.msu.su. Выделяемые сущности. 3. Содержание.

    «Тексты в памяти компьютера» - Как закодирован текст в памяти компьютера? Стр. 72 рис. 3.1 И альтернативную часть (национальную) стр. 73 – 76.рис.3.2. Задание №3. 67 79 77 80 85 84 69 82. Задание №1. Если все верно поставьте себе «5». Что такое гипертекст? Имеет стандартную часть, стоящую на всех компьютерах. Тексты в компьютерной памяти.

    «Текст документа» - 1. Указать место разрыва 2. Команда Вставка – Разрыв 3. Выбрать вариант разрыва. Форматирование списков: Удаление колонтитула. Добавление колонтитула. Колонтитулы. Табуляция. Буквица. Удаление разрыва. Вставка специальных символов в текст. Печать документа.

    «Системы оптического распознавания документов» - Цели и задачи урока: Формирование знаний о системах оптического распознавания документов. Системы оптического распознавания символов. Д/з: § 3.9. Распознаваемый символ «Б» накладывается на растровые шаблоны символов (А, Б, В и т. д.). Контроль знаний и умений: тестирование, выполнение зачетной практической работы.

    Всего в теме «Работа с текстом» 29 презентаций

    Информатика

    TextGrabber - распознает текст на фото: сканер цитат и QR кодов, позволяет сохранить в облако, поделиться и отправить в переводчик

    Описание

    ABBYY Textgrabber извлекает тексты на 60 языках или QR-коды из любых печатных источников, будь то документы, книги или объявления, и позволяет их тут же перевести на любой из 100+ языков мира.
    Сфотографируйте текст, и после распознавания его сразу же можно отредактировать, озвучить, перевести, отправить в Facebook, Twitter, Evernote или просто переслать по e-mail или SMS.
    Чтобы воспользоваться переводом, необходимо его докупить.

    -----------------------
    ***** Победитель Mobile Star Awards в категориях "Mobile Productivity App" и "Mobile Image Capture App"
    “The results get delivered relatively fast, which is great. A must have for students” - appadvice.com
    “The Best Image-to-Text App for iPhone” - lifehacker.com
    ------------------------

    КЛЮЧЕВЫЕ ПРЕИМУЩЕСТВА:
    • Распознавание текста или QR-кодов на 61 языке, в том числе русском, английском, немецком, испанском, греческом, турецком, китайском и корейском
    • Полнотекстовый перевод для 100+ языков (требуется интернет-соединение, доступен как докупка)
    • Озвучивание распознанного и переведенного текста с помощью системной функции VoiceOver
    • Удобный интерфейс для слабовидящих людей: можно увеличить размер шрифта и воспользоваться звуковыми подсказками к элементам интерфейса
    • Возможность отредактировать текст, скопировать его в буфер обмена и сохранить в других приложениях
    • Публикация текста в Facebook, Twitter, Evernote, и отправка по SMS или электронной почте в одно нажатие
    • Все тексты сохраняются в «Истории», откуда их всегда можно восстановить
    ------------------------

    С ABBYY TextGrabber легко сканировать и переводить:
    • Любые бумажные документы
    • Рецепты из кулинарных книг
    • Заметки и записи
    • Статьи в журналах и газетах
    • Фрагменты книг
    • Инструкции и руководства по эксплуатации
    • Текст состава продуктов на упаковке и многое другое…
    ------------------------
    Ограниченная поддержка для iPad 2 и iPod Touch 4 поколения – без возможности съемки камерой, т.е. только с выбором фото из галереи.
    ------------------------
    Совет по распознаванию:
    Выбирайте соответствующий оригинальному тексту язык распознавания. Это особенно важно, если он отличается от установленных по умолчанию русского и английского.
    ------------------------
    Демо видео на YouTube:
    http://bit.ly/TG-iOS-Video

    Твиттере: @ABBYY_Mobile
    Facebook группа: www.facebook.com/Abbyy.Lingvo
    Вконтакте: vk.com/abbyylingvo
    ------------------------
    Пожалуйста, оставьте отзыв, если вам понравилось приложение ABBYY TextGrabber. Спасибо!

    Что нового?

    Добавили 12 новых языков перевода.

    Нам будет очень приятно почитать ваши впечатления об этих нововведениях на странице TextGrabber в App Store!

    Отзывы Упоминания в прессе

    Программы и игры App Store со скидкой и бесплатно — 17 августа
    17 августа 2016 ukrainianiphone.com

    TextGrabber: Scan documents and printed word for digitized, editable text
    21 июня 2016 appsaga.com

    Временно бесплатно: ABBYY TextGrabber + Translator
    17 июня 2016 appcompass.ru

    TextGrabber + Translator — бесплатное приложение недели в App Store
    16 июня 2016 appsad.ru

    11 paid iPhone apps on sale for free for a limited time
    16 июня 2016 bgr.com

    Apple предлагает для бесплатной загрузки приложение ABBYY TextGrabber для распознавания и перевода текста
    16 июня 2016 macdigger.ru

    Щедрые дни в App Store. Выпуск № 392 (приложения)
    29 марта 2016 appsad.ru

    Щедрые дни в App Store. Выпуск № 388 (игры и приложения)
    13 марта 2016 appsad.ru

    ABBYY TextGrabber + Translator — приложение временно стоит 59 рублей
    17 ноября 2015 appsad.ru

    ABBYY объявила скидку 80% на TextGrabber + Translator для iOS [+10 промо]
    16 ноября 2015 macdigger.ru

    Щедрые дни в App Store. Выпуск № 299 (приложения)
    17 июля 2015 appsad.ru

    Щедрые дни в App Store. Выпуск № 282 (приложения)
    27 июня 2015 appsad.ru

    Приложения со скидкой на 26 июня
    26 июня 2015 planetiphone.ru

    Abbyy TextGrabber + Translator для iOS доступен со скидкой 80% [+5 промо]
    26 июня 2015 macdigger.ru

    Приложения со скидкой на 21 мая
    21 мая 2015 planetiphone.ru

    Акция от компании ABBYY: скидка в размере 80% на два мощных приложения
    21 мая 2015 appsad.ru

    Щедрые дни в App Store. Выпуск № 225 (приложения)
    27 марта 2015 appsad.ru

    Щедрые дни в App Store. Выпуск № 141 (Приложения)
    11 октября 2014 appsad.ru

    Приложения со скидкой на 11 сентября
    11 сентября 2014 planetiphone.ru

    Приложения со скидкой на 29 июня
    29 июня 2014 planetiphone.ru

    Скидки в App Store: TextGrabber + Translator, Fast Camera и др.
    29 июня 2014 ukrainianiphone.com

    Скидки в App Store: TextGrabber + Translator, Ticket to Ride и др.
    25 июня 2014 ukrainianiphone.com

    TextGrabber + Translator – удобный инструмент для мгновенного сканирования и перевода любых текстов
    26 мая 2014 yablochno.com

    Скидки в App Store: LEGO Batman: DC Super Heroes, LEGO® The Lord of the Rings™ и др.
    21 мая 2014 ukrainianiphone.com

    Приложения со скидкой на 29 апреля
    29 апреля 2014 planetiphone.ru

    Скидки в App Store: TextGrabber + Translator, Sid Meier’s Pirates! и др.
    19 марта 2014 ukrainianiphone.com

    Daily Deals for March 18, 2014, featuring Microsoft Office 2011 Course Bundle
    18 марта 2014 tuaw.com

    Сканирование и перевод текстов на iPad
    29 ноября 2013 ipadstory.ru

    Щедрые дни в App Store. Выпуск № 8 (приложения)
    16 ноября 2013 appsad.ru

    Abbyy’s TextGrabber + Translator 4.0 Grabs Text And Translates It
    12 августа 2013 cultofmac.com

    Сканирование и распознавание текста

    Сканирование и распознавание текста

    Сканирование и распознавание текста являются необходимыми стадиями в процессе преобразования документа на твердом носителе в цифровой формат. Это занимает гораздо меньше времени, нежели ручной способ простого перенабора текста. В результате вы получаете готовый документ, который можно редактировать в любом текстовом редакторе.

    На этом этапе задействуется специальное оборудование сканер, позволяющий получить оптическим способом электронную копию текстового документа. Однако полученные файл сродни цифровой фотографии, не смотря на то, что вроде бы на ней четко изображен текст. То есть, редактировать такой файл придется средствами графических программ, что представляется совершенно не рациональным.

    Для того чтобы работать с текстом, привычным образом в текстовом редакторе, текст придется распознать. Распознавание текста это процесс перевода графического изображения символов (букв) в компьютерные текстовые символы. Сделать это можно имея качественную цифровую копию оригинального текста и набор современных компьютерных программ для распознавания текста.

    Закажите эту услугу со скидкой!

    Для детального обсуждения условий сотрудничества, получения консультации и оформления заказа на любую из наших услуг:

    Этапы сканирования и распознавание текста

    Опуская процесс подготовки оригиналов, сам процесс сканирования и распознавания можно разделить на следующие этапы.

    1. Выбор режима сканирования. Текстовый черно-белый документ, не содержащий картинок и иллюстраций, или же эти элементы так же черно-белые, достаточно выбрать режим черно-белого сканирования или в градациях серого. Однако если текст не черно-белый, присутствуют цветные элементы, картинки, графики, схемы, и нам нужно получить точную копию, режим сканирования должен быть соответствующим, то есть цветным. Если цветность копии не принципиальна, то можно ограничиться режимом сканирования в градациях серого.

    2. Далее приступаем краспознаванию текста. Для начала с помощью специализированных программ анализируется структура документов. На этом этапе важен контроль специалиста, так как возможные ошибки на этом этапе потребуют серьезных усилий по их устранению в последствии.

    Следующий этап - непосредственное распознавание текста. Этот процесс так же доверяем компьютерным программам. Однако для успешного распознавания и минимизации ошибок, специалист должен, прежде всего, правильно подготовить документ для распознавания, настроить оборудование для получения максимально качественной цифровой копии оригинала.

    Свежеотпечатанный на принтере текст и старая газета с выцветшим шрифтом и пожелтевшей бумаге требуют к себе разного подхода на всех этапах сканирования и распознавания. Однако профессиональные опытные специалисты с помощью новейших программно-аппаратных средств отлично справляются с любыми задачами такого рода.

    3. Проверка результата и устранение ошибок. После окончания процесса распознавания, не смотря на постоянно совершенствующееся программное обеспечение, получившийся результат необходимо проверить и откорректировать вручную. Чем хуже состояние оригинала, тем больше возникает ошибок и только человек может провести коррекцию и исправить все недочеты.

    Далее происходит проверка на предмет синтаксических и орфографических ошибок, расставляются, по необходимости, знаки препинания и специальные символы.

    4. И последний этап это форматирование документа. Проверяется и если нужно корректируется размер шрифта, стили заголовков и текста, разбивается на абзацы, главы, проверяется нумерация страниц и оглавление документа. Также проверяется общая структура документа и верстка. Графические элементы, картинки, графики, схемы и другие иллюстрации так же проходят проверку на предмет соответствия.

    После проведения всех вышеописанных процедур, мы получаем точную и самое главное редактируемую копию оригинала. Теперь мы с легкостью можем вносить изменения, копировать и делится этим документом, получить необходимое количество твердых копий. На основании этого документа можно создавать свои собственные документы. При этом документ будет храниться, без риска быть испорченным, потерянным или украденным.

    Отсканировав и распознав все свои документы, переведя в цифровой вид свою библиотеку, можно создать электронный архив . удобство использования которого трудно переоценить.

    В нашей компании Вы можете быстро и качественно остканировать и распознать текст

    по цене от 3 руб. за страницу .

    Страница сгенерирована за 0.04 секунд.

    Фишки Windows 8

    Фишки Windows 8.1 (Тур 5): как пройти в библиотеку, будильник, сканирование и распознавание текста в OneNote

    Мой коллега, ИТ-специалист с большим стажем, сказал мне за обедом, что в прошлом туре открыл для себя контекстное меню кнопки Пуск. хотя и пользовался Windows 8 со времен RTM. Тут же выяснилось, что о сочетании клавиш Win + X он тоже не знал. Кто бы мог подумать :)

    Читатель starwars32 в комментариях признался, что не подозревал о кнопке «-» внизу экрана приложений. Видимо, для него будет таким же сюрпризом, что в современном интерфейсе и приложениях работает семантическое изменение масштаба. Другими словами, можно практически много где изменять вид пальцами или крутить колесо мыши с зажатой клавишей Ctrl. так же как в папках проводника и на рабочем столе.

    И при этом в прошлом туре, несмотря на толстый намек, отдельные читатели продолжали бубнить в комментариях, что это не фишки. Назло что ли?

    Тогда лучше прямо сейчас выйти на мороз и назло бабушке отморозить уши :) А я не вижу ни одной причины лишать других читателей возможности узнать что-то новое. Конструктивная критика всегда приветствуется, конечно, но лучшим аргументом будет своя фишка – нестандартная и не лежащая на виду! Остался всего один тур.

    В пятом туре конкурса фишек Windows 8.1 за лицензию на защитное решение от ESET поборются две фишки современных приложений, а также одна фишка Windows, которую Microsoft начинает потихоньку убирать.

    Приз тура

    Приз для третьего тура предоставила компания ESET .

    ESET подарит победителю на выбор лицензию антивирус NOD32 Антивирус или комплексное защитное решение NOD32 Smart Security .

    Жюри

    По формату конкурса в жюри каждого тура входят два эксперта и читатели. Как я уже писал, я приглашаю только тех экспертов, с которыми знаком лично, и сегодня я рад представить вам еще двух специалистов.

    • Павел Нагаев (MVP Exchange Server). Раньше Павел часто писал в своем блоге об Exchange. но сейчас больше снимает наболевшие вопросы на сайте ExchangeFAQ.ru. Он также выступал на конференциях TechEd. в том числе, делал совместный доклад со Станиславом.
    • Станислав Булдаков (MVP Exchange Server). Станислав делится тайным знанием об Exchange в своем блоге. И в последнее время у меня ощущение, что он управляет Exchange исключительно посредством PowerShell :)
    • Вы — выбирайте лучшую фишку голосованием в конце записи!

    Я тоже поучаствую своими комментариями в конце каждой фишки. Приступим!

    [+] В туре участвуют Как пройти в библиотеку

    Этот заголовок я «украл» из рассказа о библиотеках в данном блоге. Его я вспомнил, когда установил Windows 8.1 и не нашел библиотек! Личные папки появились в окне «Этот компьютер», но туда же теперь вела и закрепленная на панели задач кнопка проводника, а библиотеки испарились даже из области навигации.

    В задумчивости поводив по ней курсором, я ткнул правой кнопкой мыши на свободном месте и… обнаружил библиотеки в меню!

    Самое интересное, что после этого кнопка проводника на панели задач стала открывать именно библиотеки, а не «Этот компьютер».

    Бонус. Если вы пользуетесь библиотеками, вам, наверное, мешают личные папки в окне «Этот компьютер». Смотрите, их можно сложить:

    А еще в контекстном меню окна есть разные виды группировки и сортировки. поиграйте с ними для полного счастья!

    Вадим. Меню области переходов уже как-то фигурировало в одной из викторин. и тогда о нем знало менее половины участников ;) Тут еще любопытно, что в нем появилась возможность убрать столь любезное мне избранное проводника. Оно проделало интересный путь – появилось в зафиксированном виде в Vista, научилось складываться в Windows 7, а теперь… вот же как шагнул прогресс. )

    Личные папки – да, мешают, особенно на виртуалках и в PE. А вообще, создатели Windows устроили жуткий бардак с личными папками в 8.1. Возьмем для примера «Документы». Они есть в:

    • окне «Этот компьютер» и корне профиля, причем не всем может быть очевидно, что это одни и те же папки, как заметил Артем Проничкин
    • папке SkyDrive, потому что он их в вебе создает
    • на SD-карте планшета, если вы избрали ее основным местом сохранения файлов в настройках – там они имеют вид «Документы (Имя Фамилия)»
    • в виде библиотек, причем личные папки в них входят с тем же названием

    С этим надо что-то делать :)

    Приложение «Будильник»

    Приложение «Будильник», появившееся в составе Windows 8.1, включает в себя три элемента: будильники, таймеры и секундомер.

    Оно открывается на странице будильников, и для добавления нового достаточно нажать «+» в правом верхнем углу экрана.

    Чтобы будильник сработал, в ПК должна быть заложена технология InstantGo (ранее она называлась «режим ожидания с подключением»), которую поддерживают все современные планшеты с Windows.

    Иначе появится сообщение «Уведомления будут выводиться только в режиме бодрствования», т.е. приложение не разбудит ни уснувший стандартный ПК, ни вас.

    Будильники

    По умолчанию каждый сигнал будет называться Будильник. Но логично его переименовать, чтобы обозначить причину сигнала. Для этого нажмите название Будильник и введите с клавиатуры своё название сигнала.

    Внешний кружок на циферблате позволяет выбирать минуты, а внутренний – часы. Для установки нужного времени вращайте их по кругу.

    Будильник можно установить на разовое срабатывание либо выбрать дни, когда он будет включаться. В раскрывающемся меню можно прослушать и выбрать звук, который будет воспроизводиться при срабатывании будильника.

    После настройки будильника сохраните его, нажав на кнопку с изображением дискеты. В итоге все настройки отлично отображаются на экране Будильник :

    При срабатывании будильник будет издавать выбранный сигнал, а также на рабочем столе отобразится уведомление (сигнал длится меньше полуминуты, а уведомление исчезает с экрана монитора сразу же после его прекращения).

    Изменить настройки будильника можно, нажав на него, а для удаления выбранного будильника есть кнопка в правом верхнем углу экрана.

    Таймеры

    Таймеры добавляются точно так же, как и будильники. Однако таймер можно установить максимум на 12 часов 59 минут и 59 секунд.

    Для добавления часов к таймеру прокрутите внутренний кружок (минутный циферблат) на несколько оборотов — с каждым оборотом будет добавляться один час. Внешний кружок позволяет установить секунды. При желании можно запустить все настроенные таймеры, и они будут работать одновременно.

    Секундомер

    Помимо стандартного отсчета времени секундомер умеет засекать время круга и время на отсечке. Чтобы отслеживать время круга и на отсечке, нажмите на кнопку с изображением флажка. При этом список времени круга и времени на отсечке заполняется при каждом нажатии на эту кнопку.

    Примечательно, что полученные результаты можно скопировать из контекстного меню.

    Вадим. В принципе, владельцам Windows Phone приложение знакомо, хотя там только будильники, а интерфейс назначения времени отличается. Однако приложению в Windows 8.1 явно не хватает двух функций:

    1. Назначения своих мелодий для будильников
    2. Повтора сигнала через заданные (и настраиваемые) интервалы времени — за полминуты он может и не разбудить же!

    И да, я доставил это в Microsoft, когда у меня спрашивали отзыв :)

    Сканирование и распознавание текста в OneNote

    В ноябре Microsoft представила обновление своей записной книжки OneNote для Windows 8.1.

    Интерфейс приложения подвергся существенным изменениям, улучшился поиск по записям, а также появилась интеграция с кнопкой «Поделиться». Также добавились две новые возможности: «сканирование» и распознавание текста. Именно на них я хотел бы остановиться, так как работают они не совсем очевидно.

    Чтобы установить OneNote, перейдите по этой ссылке и нажмите Установить .

    Сканирование

    Под сканированием в приложении подразумевается фотографирование или вставка любого изображения и его автоматическая обработка.

    1. Щелкните в любом свободном месте страницы и нажмите на появившуюся кнопку.
    2. Выберите пункт «Камера» для фотографирования или «Рисунок» для вставки из файла.
  • Сделайте фото или выберите нужное изображение, и откроется экран редактирования.
  • Вы можете обрезать изображение и выбрать нужный режим обработки (смотрите также видео об этом ):

    Увеличить рисунок
    • Фото — вставить фотографию как есть, не обрабатывать
    • Документ — имитация сканированного документа. Получаем контрастное изображение с отчетливыми записями
    • Доска — этот режим убирает лишние мелкие детали и делает фотографию ещё более контрастной.
  • Нажмите на кнопку Вставить всё .
  • Теперь переходим к самому интересному — процессу распознавания текста.

    Распознавание текста

    Когда я впервые решил опробовать сканирование в OneNote, мне долго не удавалось найти саму кнопку для распознавания текста. Оказалось, что её здесь просто нет! После добавления фотографии она автоматически проверяется на наличие текста и распознается в облаке. Никаких дополнительных телодвижений не требуется.

    Скорее всего, эта фишка сделана не с целью извлечения текста из изображения, а поиска по нему. Другими словами, вы можете открыть поиск, ввести запрос и OneNote покажет не только результаты поиска в записях, но и по тексту в изображениях!

    Но сейчас нас интересует не это, а именно возможность использования OneNote в качестве OCR.

    Скопировать весь текст картинки можно командой Копировать текст в меню изображения:

    Текст будет скопирован в буфер обмена и его можно вставить в OneNote или любой внешний текстовый редактор:

    Качество распознавания и полезные советы

    В качестве примера к этой статье я взял первый попавшийся под руку журнал и отсканировал его страницу при 300 dpi.

    Совет. В Windows 8.1 для сканирования используется новое приложение «Сканер», которое обладает всеми необходимыми настройками и удобным интерфейсом.

    В таком «идеальном» случае все символы были распознаны верно. Фотографии с телефона распознаются чуть хуже, но на достаточно высоком уровне. Также, текст хорошо считывается со скриншотов (жизненно необходимая вещь, на мой взгляд, когда невозможно скопировать текст из окна).

    Борьба с переносами строк

    По результатам сканирования программа определила, что в статье два столбца и расположила текст в правильном порядке. К сожалению, она не стала объединять переносы строк. Но это можно сделать вручную с помощью Word и замены символов. Для небольших текстов это займет всего пару минут.

  • Откройте Word и вставьте туда распознанный текст
  • На вкладке Главная нажмите на кнопку Заменить
  • В открывшемся окне в поле «Найти:» введите строку вида:
    - ^p
  • Эта строка содержит дефис, знак пробела и знак абзаца.
  • Поле Заменить оставьте пустым и нажмите Заменить всё. На вопрос «Продолжить сначала?» Ответьте Да
  • Теперь введите в поле Найти только знак абзаца
    ^p
    и нажмите Заменить всё. также оставив поле пустым.
  • Этим алгоритмом мы стерли все знаки переносов и объединили все строки в одну. Теперь остается разбить текст на абзацы вручную.

    Распознавание русского текста

    По поводу языков распознавания стоит сказать чуть больше. Я попробовал русский и английский тексты. Как выяснилось, если в настройках системы не указана «Россия», то русский текст не читается напрочь. То есть качество распознавания и словаря зависит в первую очередь от региона. Найти эту настройку можно по запросу «Язык и региональные стандарты» в поиске или параметрах ПК.

    Заключение

    Помимо своего основного предназначения, приложение OneNote отлично подойдет в качестве программы для быстрого распознавания текста. Оно всегда под рукой, в отличие от тяжеловесных OCR-альтернатив, и обладает необходимым минимумом возможностей:

    • поддержкой русского языка
    • распознаванием столбцов
    • подсветкой орфографии

    Недостатком является непонимание переносов, но, скорее всего, этот вопрос не оставят без внимания. Сейчас же для более сложных и объемных работ, конечно, лучше использовать полноценный OCR.

    Вадим. В принципе, в классическом OneNote тоже есть OCR, и поиск по тексту изображений работает. Но нужно устанавливать платный и громоздкий Microsoft Office. И хотя ради Word он стоит у меня на планшете, на нем я пользуюсь именно современным OneNote (и да, он бесплатный). Кстати, одним из нововведений стали очень удобные при наличии нескольких книг «Недавние страницы», которых нет в Office. А вообще, запись о OneNote у меня уже второй год в черновиках.

    Хотите принять участие в конкурсе?

    Отправьте свою фишку на следующий тур конкурса и вступите в борьбу за лицензии программных продуктов и Nokia Lumia 625!

    Дискуссия и голосование

    Мне интересно ваше мнение по всем тем фишкам! Пожалуйста, ответьте в комментариях на эти вопросы :

    • Вас порадовало появление личных папок в окне «Этот компьютер» или они вам там мешают?
    • Какой у вас будильник? Вариантов же много – от FitBit до механических :) Сколько вы будильников ставите на утро?
    • Вы пользуетесь OneNote, хотите больше узнать о нем? Мне стряхивать пыль с черновика. )

    И обязательно расскажите, за какую фишку вы проголосовали!

    Итоги тура

    В голосовании читателей за явным преимуществом победило сканирование и распознавание текста в OneNote. Эту же фишку выбрали оба эксперта, которые обещали поделиться своими мыслями в комментариях.

    Таким образом, в пятом туре победил Владислав с фишкой OneNote. Он получает лицензию ESET и зарабатывает дополнительное место в финале – мои поздравления!

    Результаты голосования утеряны в связи с прекращением работы веб-сервиса опросов.

    Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

    Об авторе

    Вадим является владельцем этого блога, и большинство записей здесь вышло из-под его пера. Он также давно и успешно занимается развитием сообщества OSZone.net. Подробнее обо всем этом здесь .

    Вас также может заинтересовать:

    Подпишитесь на бесплатные уведомления о новых записях и получите в подарок мою книгу об ускорении загрузки Windows !