Давайте вспомним далекие 2000-е годы… Когда так хотелось перенести текст с учебника в шпаргалку или сохранить важную информацию с газеты либо книги. В те времена распознавание текста было под силу только сканеру или специализированной программе.
Но эпоха операционной системы XP канула в прошлое, и теперь, сидя с ноутом или держа в руке смартфон, мы можем «перенести» без усилий текст с картинки в вордовский файл. Выполняют такое нелёгкое дело сервисы для распознавания текста — все они разные, поэтому мы решили проанализировать их и взвесить все «за» и «против».
Что это такое и откуда появилось?
Интересно, что прототипом подобных сервисов стала машина Таушека — механизм, запатентованный Густавом Таушеком в 1929 году в Германии. В нём использовался фотодетектор и шаблоны.
Прошло почти столетие, и на смену подобного рода механизмам пришел сервис распознавания текста (либо сокращенно OCR-сервис), который преобразует печатные, отсканированные или графические документы в текстовый формат данных. Кстати, с английского языка OCR расшифровывается как оптическое распознавание символов.
Сейчас такие сервисы доступны как на ПК, так и на смартфоне. Их используют, чтобы оцифровать книгу либо документ. Также эти сервисы нужны при автоматизации различных бизнес-процессов.
Список лучших OCR-сервисов
Чтобы выбрать лучшие сервисы для распознавания текста, мы учли несколько факторов — количество входящих и исходящих форматов, «знание» языков, поддерживаемые платформы, а также функционал в зависимости от платной и бесплатной версии.
Итак, в наш список попали:
- Google Disk
- OCR convert
- Microsoft Office Lens
- Fine reader
- img2txt.сom
- i2OCR
- Adobescan
- NewOCR
- Onlineocr
- Microsoft OneNote
- Readiris 17
- go4conver
- Convertio
- Sodapdf
Ниже мы подробно изучили преимущества и недостатки каждого сервиса, чтобы вы смогли подобрать для себя оптимальный вариант.
Google Disk
Самое первое, что вам придется сделать, если у вас нет Google-аккаунта, это пройти регистрацию. Но с этим не должно быть каких-либо проблем, так как сегодня почти каждый имеет свой Google-аккаунт.
Гугл Диск работает со стандартными картинками (TIF, JPG, PNG и др.), размер которых не больше 2 Мб. Кроме того, он способен определять PDF-документы. У вас могут возникнуть неудобства при считывании многостраничных документов. Дело в том, что сервис распознает первые 10 страниц. Но если вам нужно «перенести» пару страниц, то он с этим отлично справится. Google Disk предлагает сохранить готовый текст в формате MS Word или блокнота, а также в PDF, ODT, RTF, HTML и т.д. Доступен Google Disk почти на всех популярных платформах: Windows, macOS, Android, iOS, Chrome OS.
Пошаговая конвертация:
- Откройте страницу drive.google.com на компьютере.
- Нажмите на нужный файл правой кнопкой мыши.
- Выберите «Открыть с помощью» затем «Google Документы».
Плюсы:
- распространенный сервис, т.к. Google-аккаунт есть почти у всех;
- бесплатный ресурс.
Минусы:
- лимит на изображения — до 2 Мб;
- распознает всего 10 первых страниц.
Веб-сайт: Google Диск
OCR Convert
Данный онлайн-сервис вы можете использовать в веб-версии совершенно бесплатно. Но, к сожалению, его функционал ограничен: вы сможете конвертировать только самые распространенные форматы: GIF, JPEG, BMP, PDF и PNG.
Готовый текст сохраняется как URL-ссылка с расширением TXT. Многократно вы можете загружать до 5 файлов. Лимит на объем — до 5 Мб.
Плюсы:
- удобный, отзывчивый интерфейс;
- загрузка документа прямо с URL;
- не нужно регистрироваться;
- работа с картинками в низком разрешении.
Минусы:
- малый выбор форматов для исходников;
- преобразует только в TXT;
- ограничения по загружаемым файлам.
Веб-сайт: ocrconvert.com
Microsoft Office Lens
Вы сможете определить текст с картинки при помощи камеры. Но насколько хорошо Office Lens умеет это делать? Мягко говоря, не очень. Работает через раз, часто глючит и вылетает. В связи с тем, что Office Lens бесплатный, готовьтесь к просмотру рекламных объявлений.
Но если вы все-таки выбрали его, то у вас получится конвертировать картинки в три распространенных формата: Adobe PDF, Word и PowerPoint. Плюс ко всему, изображения можно сохранить в OneNote и OneDrive. Приготовьтесь к тому, что приложение регулярно будет предлагать поделиться текстом и использовать облако OneDrive. MS Office Lens поддерживается такими платформами: iOS, Android, Windows.
Плюсы:
- бесплатное приложение;
- поддержка русского языка.
Минусы:
- частые глюки приложения;
- плохая оптимизация;
- большое количество рекламы;
- частые предложения использовать OneDrive;
- не всегда распознает текст.
Скачать приложение: iOS, Android.
FineReader
Онлайн-сервис популярен благодаря высокой точности распознавания текста. Но, к сожалению, возможности бесплатной версии очень ограничены. Сервис разрешает отсканировать до 10 страниц после регистрации. Но есть один приятный момент: каждый месяц вы будете получать +5 бонусных страниц.
Платная версия (129 евро в год) позволит отсканировать 5 тысяч страниц и откроет доступ к PDF‑редактору. В целом, сервис обрабатывает и сохраняет много распространенных форматов. FineReader распознает более 190 языков.
Плюсы:
- достаточное количество форматов;
- преобразует результат в разные форматы;
- «знает» много языков.
Минусы:
- ограниченные функции бесплатной версии;
- необходима обязательная регистрация.
Веб-сайт: finereaderonline.com
img2txt
Дизайн сайта привлекает своих посетителей удобством и простотой. Характеристики img2txt.сom тоже весьма неплохи, и производительность достойная.
Работает почти со всеми форматами, но не распознает текст, написанный от руки. Помимо этого, img2txt.сom поддерживает PDF-документы. Сервис предлагает сохранить результат в ODF, DOCX, PDF, TXT либо XLS. Ограничение на размер исходника составляет до 8 MB. У сервиса нет мобильного либо Desktop-приложения.
Плюсы:
- высокая производительность;
- отсутствие регистрации;
- русский интерфейс;
- удобный дизайн;
- поддержка популярных форматов;
- интеграция с Google Документы;
- защита данных;
- распознавание выделенной области изображения.
Минусы:
- недостаточно языков распознавания (до 35);
- небольшое количество доступных форматов для результата.
Веб-сайт: img2txt.com/ru
i2OCR
Если вы совсем не готовы платить и хотите распознать текст бесплатно, то обратите внимание на этот онлайн-сервис. Вам предоставляется возможность загрузить исходники популярных форматов (даже TIF, PBM, PGM и PPM). А вот с сохранением выбор невелик: вордовский документ, блокнот, PDF либо HTML. При этом приложение может похвастаться «знанием» более 60 языков (конечно же, и русского тоже).
Из недостатков i2OCR стоит упомянуть лимит на объем — до 10 Мб. Кроме того, он не определяет рукописный текст. i2OCR доступен в веб-версии.
Плюсы:
- поддержка многих форматов исходников;
- бесплатный сервис;
- поддержка популярных языков;
- возможность редактирования распознанного текста в Google Docs.
Минусы:
- лимит в объеме — до 10 Мб;
- ограниченность форматов готового текста.
Веб-сайт: i2ocr.com
Adobe Scan
Так же, как и рассмотренное ранее приложение Office Lens, Adobe Scan использует камеру телефона и сканирует изображения на бумаге. Но он сохраняет их всего лишь в ПДФ-формате.
Распознавание текста с экрана удобно экспортировать в Adobe Acrobat, позволяющий отредактировать PDF-файл (подчеркивать/зачеркивать слова, выделять их, искать слова и словосочетания в тексте, а также добавлять комментарии. Бесплатное приложение доступно на Android и iOS.
Плюсы:
- удобный интерфейс;
- бесплатное приложение;
- экспорт файлов в Adobe Acrobat.
Минусы:
- хранение документов в облачном хранилище.
Скачать приложение: iOS, Android.
NewOCR
С помощью этого помощника вы сможете распознать почти любой графический файл и даже ZIP-архивы. NewOCR отлично владеет 122 языками. Правда, конвертирует из изображений всего лишь три формата текста: MS Word, блокнот и PDF.
Отличная плюшка сервиса — он не требует регистрации. Также стоит учесть, что все ваши данные защищены. NewOCR хорошо распознает многоколоночный текст, а также позволяет считывать информацию с определенной области макета. Доступен сервис в веб-версии.
Плюсы:
- поддерживает много форматов и языков;
- высокий уровень защиты (после вашей работы с сервера удаляются файлы);
- не нужно регистрироваться;
- неограниченное количество загрузок.
Минусы:
- плохо считывает текст с материала низкого качества.
Веб-сайт: newocr.com
Onlineocr
В отличие от остальных конкурентов Оcr-онлайн считывает с большого количества форматов изображений. Но размер этих картинок не должен быть более 15 Мб в свободном доступе.
Несмотря на поддержку множества файлов, он преобразует результат только в три формата: MS Excel, MS Word и блокнот. Доступен Оcr-онлайн сервис распознавания текста только в веб-версии.
Плюсы:
- поддержка многих форматов изображений;
- сервис русифицирован;
- лаконичный дизайн;
- защищенное соединение;
- возможность скачать множество файлов ZIP-архивом.
Минусы:
- всего три формата готового результата;
- лимит при загрузке файлов.
Веб-сайт: onlineocr.net
Microsoft OneNote
Известный всем блокнот умеет также распознавать текст на изображениях. Когда вы кликаете правой кнопкой мыши по снимку и выбираете во всплывающем меню «Копировать текст из рисунка», то содержимое текста перемещается в буфер обмена. Сохраняется результат в вордовском либо ПДФ-документе.
Приложение доступно бесплатно. Поддерживается на платформах Windows и macOS.
Плюсы:
- простота использования;
- удобный интерфейс.
Минусы:
- скудное количество форматов готового документа.
Скачать по ссылке: onenote.com
Go4convert
Это шустрая и лёгкая в использовании онлайн-платформа, преобразующая различные документы в PDF, WORD, EPUB, FB2, RTF, TXT и прочие форматы.
Основное преимущество — она не имеет ограничений по размеру загружаемых исходников. Не стоит только забывать, что чем больше изображение или документ, тем дольше сервис будет с ним работать. Go4convert доступен в веб-версии.
Плюсы:
- удобство и простота;
- нет лимитов по размеру исходников;
- поддержка русского языка;
- большой выбор форматов.
Минусы:
- чем больше размер файла, тем дольше сервис его преобразует.
Веб-сайт: go4convert.com
Readiris 17
Это мощная программа, которая достаточно быстро считывает текст с PDF-файлов и прочих форматов изображений. Предусматривает знание многих языков (русский в том числе). При конвертировании предложит вам сохранить результат в формат MS Word, MS Excel, PowerPoint, блокнот, ПДФ и т.д.
Но эта программа не бесплатная. Пробная версия после регистрации работает всего 10 дней, дальше нужно платить. Тариф колеблется от 49 до 199 евро зависимо от необходимых функций.
Плюсы:
- мощная производительность;
- удобный дизайн;
- «знает» много языков;
- использование продвинутых алгоритмов распознавания;
- поддержка популярных форматов изображения.
Минусы:
- необходима регистрация;
- программа платная.
Convertio.co
Сравнивая с другими конкурентами, Convertio.co — удобный и производительный сервис. Он работает с разными форматами, однако сохраняет готовый материал только в DOCX, PLX, PDF и TXT. Также смущает небольшое количество языков.
Если вам нужно «перенести» текст с документа, Convertio.co сможет проработать всего лишь 10 страниц. Если хотите конвертировать больше, придется проходить регистрацию. Сервис доступен в веб-версии.
Плюсы:
- русский интерфейс;
- интеграция с известными облачными сервисами;
- лаконичный дизайн;
- высокая производительность;
- поддерживает распространенные форматы картинок.
Минусы:
- мало языков распознавания;
- ограниченное число форматов готового текста;
- необходимость регистрации.
Веб-сайт: convertio.co
Sodapdf
Ранее этот сервис назывался Free-ocr.com. Он очень удобный и имеет простой дизайн. В активе sodapdf.com насчитывается 46 языков. С форматами дела обстоят не очень хорошо. В целом, он форматирует PDF в MS Word, PDF в Эксель, PDF в PowerPoint, PDF в HTML.
Главная фича — это возможность загружать файлы большого размера (до 800 Мб). Кроме того, sodapdf.com умеет объединять PDF, изменять размер данного формата и прочее. Работает в веб-версии.
Плюсы:
- функции редактирования PDF-файлов — обрезка, объединение и прочее;
- высокое ограничение по объему файла – 800 Мб;
- достаточный диапазон разрешений.
Минусы:
- не поддерживает русский язык;
- малый выбор языков.
Веб-сайт: sodapdf.com
Сложно представить, насколько сервисы для распознавания текста упростили нам жизнь. Теперь каждому под силу зайти на сайт, загрузить туда интересующее изображение и получить за считанные минуты текст. Если вам нужно преобразовать обычный JPEG или PNG, вам подойдет NewOCR, i2OCR, OCR Convert и прочие. Если вы — активный пользователь смартфона, то скачайте приложение Microsoft Office Lens или Adobe Scan.
А какое приложение или сервис используете вы? Поделитесь в комментариях!