Как распознать текст с картинки онлайн – обзор веб-приложений
- 17.03.2015
Если у вас возникает необходимость распознать текст с картинки или файлов PDF и у вас нет в наличие специального программного обеспечения, то вы попали по адресу. В основном для этой задачи используют программу FineReader, но она стоит довольно дорого. Не покупать же нам программу из-за одной или двух картинок, которые хотим распознать и конвертировать в документ. В этом случае помогут специальные онлайн сервисы, созданные именно для распознания текста с картинки. Давайте рассмотрим некоторые из них.
Я постараюсь рассмотреть бесплатные и платные онлайн сервисы, потому что на сегодняшний день бесплатного становиться все меньше и меньше. Рассмотрим сервисы для распознания текста с картинки или PDF-файлов
OCR CONVERT
OCR CONVERT – бесплатное веб-приложение, с помощью которого можно распознать текст с картинки онлайн. В дальнейшем текст может быть отредактирован, отформатирован и переведен в электронный документ. OCR может быть использован для конвертации книг и документов в электронный формат и для автоматизации различных бизнес-процессов.
Для начала загружаем картинку в веб-приложение, нажав на кнопку Обзор (выбираем файл), выбираем язык (русский язык), и нажимаем на кнопку Process для распознания текста.
Особенности сервис OCR Convert:
- Точное распознание для преобразования текста;
- Поддерживает PDF, GIF, BMP, JPEG в качестве входного файла;
- Поддерживает низкое разрешение изображения;
- Работает онлайн - установка на компьютер не требуется;
- Позволяет загружать до 5 картинок;
- Автоматическая настройка изображения для лучших результатов;
- Распознает картинки размером до 5Мб.
Единственный недостаток, который я заметил – на выходе можно получить только файл txt. Но и этого вполне хватает.
i2OCR
I2OCR – бесплатный сервис, где можно быстро и без проблем распознать текст с изображения (если на ней есть текст) и сохранить в формате текстового файла. Как и аналогичный сервис, этот прост в использовании.
Особенности сервис i2OCR:
- Сервис предлагает распознание текста в неограниченном количестве;
- Поддержка 60 языков (русский, английский и другие);
- Поддержка всех основных форматов изображений (входные файлы): JPG, PNG, BMP, TIFF и т.д.;
- На выходе получаете документ в формате: Microsoft Word, Adobe PDF;
- Поддержка многоколоночных текстов;
- Есть возможность загружать изображения из URL, облачных сервисов и жесткого диска;
- Можно продолжить работу в Google Docs, а также переместить текст в онлайн переводчики Google или Bing;
- Конфиденциальность данных пользователей.
Есть ограничения: входные файлы не больше 10 Мб и не распознает почерк (только машинописный текст).
ONLINEOCR.NET
ONLINEOCR.NET – мощный и многофункциональный сервис OCR (Optical Character Recognition, то есть оптического распознавания символов), благодаря которому можно быстро распознать текст с картинки, PDF-файлов и многих других форматов. Возможности сервиса хорошие, но в пределах разумного – файл должен быть с разрешением, с которого можно будет произвести распознание. Сервис поддерживает 46 языков, в том числе русский, украинский.
Преобразованные документы выглядят в точности как оригинал - таблицы, столбцы и графики. OnlineOCR.net это бесплатный сервис распознавания текста в «гостевой режим» (без регистрации), что позволяет преобразовывать 15 изображений в час. Регистрация даст вам возможность конвертировать многостраничные PDF-документы и другие форматы.
Поддержка входных файлов (не больше 5 Мб) в формате PDF и изображений (JPG, BMP, TIFF, GIF) и выходные распознаются и преобразуются в Word, Excel и другие текстовые форматы. Для того, чтобы начать процесс распознания текста с изображения или PDF-файла, нужно проделать 3 шага:
- загрузить файл, нажав на кнопку Select file;
- выбрать язык, указать выходной файл (например, DOCX);
- нажать на кнопку Convert.
После можно отредактировать полученный текст прямо в окне браузера или сохранить себе на компьютер.
OCRONLINE
OCRONLINE – онлайн сервис, который позволяет распознать текст с картинки (разрешения JPG, TIFF, PNG, GIF), а также PDF-файлов. Сервис поддерживает высокую точность распознавания текста на нескольких языках, и многостраничные документы сложной верстки. OCROnline имеет улучшенный многоязычную поддержку и возможность обработки документов на 153 языках мира. И при всем этом сервис бесплатный. На выходе можно получить файлы в формате TXT,DOC, RTF или PDF, что очень даже не плохо.
Есть и ограничения:
- Обязательная регистрация в сервисе (займет не более 1 минуты);
- Каждый пользователь получает 5 страниц бесплатно при регистрации. Но каждый понедельник лимит обнуляется и опять в запасе 5 страниц;
- Размер файла не более 10 Мб;
- Файлы хранятся 24 часа, после чего удаляются (так что после распознания, сразу скачивайте на свой компьютер).
Для того чтобы преобразовать картинку в текст, необходимо для начала зарегистрироваться. После получаем доступ к аккаунту сервиса OCROnline и начинаем выполнять следующие действия:
- Выбор языка;
- Формат исходного файла;
- Загружаем файлы (картинки или PDF-файл), нажав на кнопку Browse и Upload;
- Кликаем по ссылке PROCESS;
- Получаем ссылку для скачивания файла.
Могу отметить, что для бесплатного сервиса очень неплохо распознает текст, так что пользуйтесь.
NEWOCR.COM
NEWOCR.COM - это бесплатный онлайн сервис OCR (оптического распознавания символов), может анализировать текст в любом файле изображения, которое вы загружаете, и затем конвертировать картинку в текст, который можно легко редактировать на вашем компьютере.
Особенности:
- Неограниченная загрузка файлов;
- Регистрация не требуется;
- Сохраняет данные в безопасности (все загруженные пользователем файлы удаляются с сервера);
- Поддержка до 75 языков и шрифтов;
- Поддержка многоколоночный документ;
- Картинки можно вращать: по часовой стрелке/против часовой стрелки на 90°, 180°;
- Различные варианты отображения и обработки полученного текста
- Можно продолжать редактирование документа в Google Docs
- Перевод с помощью Google Translate или Bing Translator
- Копировать в буфер обмена
- Поддерживает плохо отсканированных и сфотографированных документов;
- Поддерживает изображения с низким разрешением.
Входные форматы файлов:
- Изображения: JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX;
- Сжатые файлы: Unix compress, bzip2, bzip, gzip;
- Многостраничных документов: TIFF, PDF, DjVu;
- Документы:DOCX, ODT файлов с изображениями;
- Несколько изображений в ZIP-архиве;
Форматы выходных файлов
- Обычный текст (TXT);
- Microsoft Word (DOC);
- Adobe Acrobat (PDF);
Для того, чтобы распознать текст с картинки: загружаем файл (кнопка Обзор) или указывает ссылку на него (File URL). После этого нажимаем на кнопку Preview. На Следующей странице добавляем язык (по умолчанию стоит русский и английский), указываем поворот входного файла (картинки), если в тексте есть колонки, то ставим галочку (Page layout analysis - split multi-column text into columns) и нажимаем на кнопку OCR. По окончанию получаем распознанный текст, который можно скачать, нажав на кнопку Download.
FREE-OCR.COM
FREE-OCR.COM - это бесплатный онлайн инструмент для распознания текста с изображений и других файлов. Этот сервис можно использовать этот сервис для извлечения текста из любого изображения, которые вы загрузите. Услуга сервиса Free-OCR.com предоставляется бесплатно, регистрация не требуется. Просто загрузите файлы изображений. Free-OCR принимает либо JPG, GIF, TIFF, BMP или PDF (только первую страницу).
Единственным ограничением является то, что изображения должны быть не более 2 Мб, не шире или выше, чем 5000 px и существует ограничение 10 изображений в час. Free-OCR может обрабатывать изображения с несколькими столбцами текста, а также поддерживает 29 языков.
Для преобразования файла, потребуется выбрать данный файл, исходный язык, ввести капчу и нажать на кнопку Send file. После получаем в окне браузера распознанный текст. Тут, к сожалению нельзя скачать в виде документа Word.
FINEREADER ONLINE
FINEREADER ONLINE – это классический вариант распознания текста с картинки или PDF файла. Данный сервис является аналогом приложения FineReader под Windows. Так как программное обеспечение является платным, то и сам сервис не бесплатен, то есть имеет определенные ограничения. Но по своему функционалу, как мне показалось, превосходит все выше перечисленные онлайн сервисы.
FineReader Online позволяет распознать отсканированные документы в следующие форматы: JPEG, BMP, PNG, TIFF, PCX, DCX в исходные форматы документов Word, Excel, PowerPoint, PDF, а также текстовые файлы – TXT. Поддержка 30 языков.
Есть недостатки:
- Обязательная регистрация;
- Документы хранятся 14 дней, после чего удаляются;
- Бесплатная версия позволяет распознать всего лишь 10 страниц. Если хотите больше, то уже надо платить.
Для того чтобы распознать текст сервисом FineReader Online, нужно для начала зарегистрироваться (займет не более 1 минуты) и загрузить свой аккаунт, нажав по ссылке Распознание (в верхнем меню) или кнопку Распознать. Далее загрузится довольно удобный интерфейс, где все разбито по этапам:
- Загрузить файл для распознания;
- Выбрать язык документа (можно несколько, так как в файле может присутствовать не один язык в тексте);
- Выбрать формат документа;
- Распознать.
После завершения процесса распознания текста с файла, его остается скачать на свой компьютер.
Теперь подытожим, есть множество онлайн сервисом для распознания текста с картинки/изображения или других файлов. О некоторых из них, вы узнали сегодня и наверняка воспользовались, а другие закинули в закладки браузера. Говорить, что один сервис лучше другого не стану, лучше вам сравнить и выбрать для себя наилучший и оптимальный вариант. Все вышеперечисленные сервисы не являются профессиональным веб-приложениями в сфере сканирования и распознания текстов, а всего лишь палочки-выручалочки в трудных ситуациях, когда нужно быстро получить текст с небольшого документа.
Добавить комментарий
Комментарии
Конкурентные преимущества:
1. Сервис распознает текст на изображениях лучше, чем 80% других аналогичных сервисов.
2. Абсолютно бесплатный сервис, неограниченное количество распознаваний текста.
Надеюсь, ваши посетители останутся довольны качеством распознавания текста в дальнейшем.
Спасибо за внимание!
Категории
Последние темы
- Анонимные прокси от сервиса Proxys.io для решения любых задач
- Международный экзаменационный Центр IELTS PROFI, где можно улучшить свой английский язык
- Сервис Serphunt – бесплатная проверка позиций сайта в Яндексе и Google
- Обзор портала о страховании INGURU: онлайн-калькулятор, покупка полисов, информация
- Выставить-счет.рф – сервис для выставления счета и ведения бухгалтерской документации онлайн
- SendPulse - обзор сервиса для автоматизации маркетинга: email рассылка, push-уведомления, SMS-рассылки, чат-боты
- Envybox – сервис для сайта: онлайн чат, обратный звонок, квизы, стадный инстинкт
- Российская CRM-система «Простой бизнес» для организации бизнеса