✅ ПОЛУЧИТЬ | 1 099₽ 💁🏻♂️ Duolingo Super — это расширенное премиум-дополнение для изучению иностранных языков, подписка "Super" имеет определенные преимущества: отсутствие рекламы, возможность сохранения уроков на мобильном устройстве, бесконечные жизни, досрочные сдачи навыков без ограничений, ежемесячное восстановление ударного режима, проверка владения языком. └ Данную акцию Duolingo проводят при сотрудничестве с Amazon, непонятно сколько продлится раздача: Duolingo Super на 1 месяц, но если она проживет более 1 месяца, в таком случае - вы сможете снова зарегистрировать новый аккаунт и продолжить обучение иностранных языков. └ Учиться на Duolingo увлекательно, кроме мобильной платформы: iOS / Android - по изучению языков, компания также создала Duolingo English Test — доступную и удобную сертификацию владения языком, которую принимают тысячи университетов по всему миру.
Привет всем! Я расскажу о сервисах для распознавания текста или OCR. Считайте это небольшим рейтингом лучших OCR-утилит.
Обложка поста сгенерирована нейросетью
Оптическое распознавание символов (OCR - Optical Character Recognition) - механизм электронного или механического конвертирования изображения или печатного текста, например, с отсканированного документа, фотографии и т.д.
Я испытаю следующие программы и сервисы:
PDF - Adobe Acrobat Pro - эталон всех распознавателей.
PDF24 tools - богатый инструментарий для работы с PDF-документами, включает OCR.
NewOCR - заявляют себя как сервис конвертации в текст форматов: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu.
Img2txt - сервис отличается красивым интерфейсом, но спасёт ли его это?
Free Online OCR - простецкий онлайн-сервис для распознавания.
Чтобы результат был наглядным и достоверным, нужно протестировать. Для этого я подготовил специальные документы:
Фрагмент статьи “8 бесплатных аналогов платных программ для переводчиков” из подборки. Текст был написан в ворде, затем переведён в PDF. Сложность может представлять надпись нестандартным шрифтом, мелкие буквы, а также текст на эмблеме, но в целом документ простой и имеет текстовый слой.
Тот же фрагмент, но без текстового слоя - скрин, завёрнутый в PDF. Базовые сложности те же, только к ним ещё добавляется необходимость распознавания всего остального текста и необходимость сохранить форматирование.
Рекламная брошюра масел. Сложное и разное форматирование, местами текстовый слой есть, местами его нет. Отнюдь не простой документ. Посмотрим, справятся ли конкурсанты.
Adobe Acrobat Pro
Я попробую сравнить качество распознавания при конвертировании в редактируемый формат между бесплатными сервисами и эталоном - Adobe Acrobat DC.
Adobe Acrobat DC идёт первым как эталон, созданный для одной задачи - для работы с pdf-файлами.
Простой файл с текстовым слоем:
Ожидаемо. Никаких трудностей. Полная конвертация в редактируемый формат. Изображение по центре осталось нетронутым, но это невеликая проблема, можно подписать или обработать в Paint.
Простой файл без текстового слоя:
Нестандартный шрифт не распознался, но мелкий шрифт под звёздочкой распознался достаточно хорошо. Ещё пару букв пропустил, но допустимая погрешность для последующего ручного редактирования.
Сложный файл с непостоянным текстовым слоем:
Как сказать. Результат ожидаемо плохой, потому что файл очень сложный. Впрочем, отредактировать всё равно можно, лучше, чем ничего.
Почему я не взял на тест больше программ для ПК? А их нет. Существует несколько простых программ, которые распознают только изображения или устанавливают на компьютер мусор. Я пробовал: Free OCR, Simple OCR, CuneiForm OCR, Freemore OCR. Вторая категория - это титаны вроде Abbyy или Adobe, которых мы стараемся избежать в этой статье.
Итак, перейдём к онлайн-сервисам.
PDF24 tools
PDF24 tools - многогранный сервис. Он может распознать текст в PDF, но в результате всё равно выдаст PDF. На наше счастье среди утилит этого сайта есть и конвертер в Word. Они даже расположены рядом.
Простой файл с текстовым слоем:
Получилось очень плохо, но текст типа сохранён полностью. Изображение вырезано и половина страницы пустая. Ладно, сочтём, что так и должно быть.
Простой файл без текстового слоя:
С задачей сервис не справился. После распознавания и конвертации в ворд, я увидел пустой лист.
Сложный файл с непостоянным текстовым слоем:
Результат оказался таким же - пустой лист. Но сервис предлагает три режима конвертации:
Я попробовал все три, лучший результат выдал третий режим "только текст":
Распознался даже сложный шрифт!
Брошюра тоже распозналась, но легче мне от этого не стало:
Вердикт:
Спорный сервис. Конвертирует и распознаёт быстро и удобно, много разных утилит. Пусть будет, конечно, на крайняк покатит.
NewOCR
NewOCR - нашёл в одной из статей про лучшие сервисы распознавания символов на просторах интернета. Говорят, что сервис хороший.
Простой файл с текстовым слоем:
Текст распозанёт хорошо, но предлагает выбрать только формат .txt, не распознаёт картинку и даже не пытается сохранить форматирование.
Простой файл без текстового слоя:
Неплохо распознал основной язык - русский, но ужасно справился с английским. Вся латиница превратилась в какую-то кашу. С другой стороны распознать получилось даже нестандартный шрифт с картинки. Не без ошибок, нор всё же. А ещё удалось получить формат Word. От чего это зависит - не знаю.
Сложный файл с непостоянным текстовым слоем:
Брошюра тоже распозналась косячно. Вместо многих символов ужасные кракозябры, слова собрались в кашу, формат только .txt. Зачем мне нужно вот это? Легче отредактировать скриншоты в paint, чем так.
Вердикт:
Сервис неплохо справляется с распознаванием текста, но что-нибудь сложнее, чем абзацы текста ему не под силу. Если в тексте встречается несколько языков, то один из них обязательно будет воспринят неправильно. Даже если указать два языка в поле перед распознанием. Про форматирование можно забыть, его здесь не будет. А ещё мне не понравилось, что каждую страницу многостраничного документа придётся распознавать и скачивать отдельно. Документ на 50 страниц? Простите, но придётся выкачивать по одной странице за раз. А ещё придётся подождать 5 секунд перед распознанием очередной страницы. Не больше ни меньше. Если попытаетесь распознать быстрее, получите ошибку. А ещё не всегда с первого раза точно прицеливается в страницу, иногда выхватывает маленький фрагмент страницы и пытается его распознать.
Img2txt
Сервис Img2txt. Нашёл его где-то на просторах интернета в комментариях к статье о лучших сервисах.
Простой файл с текстовым слоем:
Крупный текст распознал, мелкий превратил в кашу. Решил, забить на текстовый слой и распознал только картинку. Странное решение. Зато предлагает много форматов.
Простой файл без текстового слоя:
Не сказать, что плохо, но и не сказать, что хорошо. Некоторые буквы перепутал, латиницу не распознал. Но по крайней мере можно скачать в вордовском формате.
Сложный файл с непостоянным текстовым слоем:
Слева оригинал, справа результат распознания
Куцый результат. Распозналось плохо, большая часть текста пропущена, слова в кашу превратились. Получилась бесполезная белиберда.
Вердикт:
Ещё один сервис, который распознаёт неплохо простые документы с большими абзацами текста. Раздражает, что сначала нужно загрузить файл, выбрать для него язык, потом файл обработается сервером, нужно снова выбрать для него язык и запустить распознавание. Я как-то ожидал, что загружая я уже достаточно чётко выражаю намерение распознать файл.
Ещё одна беда - это постраничное распознавание. Как и в случае с NewOCR каждая страница распознаётся отдельно, скачивается отдельным документом. Только тут ещё необходимо для каждой новой страницы повторно выбирать язык.
А ещё это единственный сервис с ограничением размера файла. Максимум - 8 мб.
Online OCR
Online OCR - сервис с самым непримечательным названием. Я упоминал этот сервис в статье про 8 бесплатных аналогов платных программ.
Простой файл с текстовым слоем:
Ого. Результат удивляет. Почти идеальный. Мало того, что распознание прошло почти мгновенно, так ещё и латиница распозналась там, где надо. Даже мои опечатки были распознаны правильно. То что текст вокруг картинки - это ерунда. Чуть-чуть не дотянул до уровня Adobe.
Простой файл без текстового слоя:
Снова в яблочко! В этот раз побольше промахов, но результат достойный. Хотя бы картинка сохранилась и часть мелкого текста с неё удалось распознать.
Сложный файл с непостоянным текстовым слоем:
Ух ты! Сервис справился с распознаванием и этого документа! Удивительно, но факт. Есть некоторые недочёты, но это очень хороший результат. С редактированием такого файла в ворде придётся очень сильно помучиться, зато распознаны все таблички, большинство надписей. Если в ваши обязанности не входит вёрстка, то это именно то, что нужно.
Я бы назвал это самым большим успехом. Даже Adobe по сравнению с этим меркнет:
Adobe слева, Online OCR справа
Вердикт:
Это лучший сервис! К сожалению, без регистрации он не даст распознать PDF больше 15 страниц, большие изображения, ZIP-архивы и ещё что-то. Но после регистрации сервис даёт только 50 бесплатных страниц.
Я слышу слово "абьюз" или мне кажется? Раскрою секрет, как сделать сервис абсолютно бесплатным. Создатели сайта не придумали подтверждение почты при регистрации. Можно указать любой вымышленный адрес. Как только заканчиваются страницы, переезжаем на новый аккаунт и пользуемся 50 бесплатными. Забавно получается.
Читайте другие статьи переводческого цикла в серии постов.
Если вам интересен подобный контент, приглашаю подписаться на мой телеграм-канал @grolchannel, где я публикую разнообразные посты значительно чаще.
1. Получите бесплатную подписку на сервис VK Музыка на 30 дней по промокоду: PROB30
Акция доступна для новых пользователей музыкальной подписки VK Музыка ВКонтакте.
После окончания пробного периода стоимость подписки будет составлять 159 руб./мес.
2. Получите 21 день бесплатной подписки на онлайн-кинотеатр PREMIER по промокоду: 7d6encb2. Акция доступна для всех клиентов без активной подписки по всей России. Далее подписка будет стоить 299 руб. в месяц.
3. 500 рублей при оформлении карты тинькофф на счет по ссылке. Бесплатное обслуживание НАВСЕГДА, вместо 1190 в год, при оформлении дебетовой карты Tinkoff Black. С дебетовыми картами Тинькофф Банка клиенты получают кэшбэк рублями или бонусами за каждую покупку. На странице оформления можно выбрать 4 любимых категорий покупок. До 30% кэшбэка при совершении покупок у партнеров, перечень которых постоянно обновляется. Перевод без комиссии на карты других банков через СБП.
4. В Альфа банке дают 500 рублей за оформление дебетовой Альфа-Картыпо ссылке. Она бесплатная, без комиссии переводы и платежи. С суперкэшбэком до 100% каждый месяц и ещё по 5% в четырёх категориях на выбор.
5. До 31.10. 2023 года Спортмастер дарит скидку - 20% на одежду, обувь и аксессуары по промокоду: GSUM142
Скидка по промокоду суммируется с розничными скидками, при условии, что общая сумма скидки не превышает 50%.Акция не распространяется на бренды Columbia, Salomon, Bask, SHU, KRAKATAU, RedFox, New Balance. Скидки по промокодам не действуют на товары c жёлтыми ценниками и товары, отмеченные знаком «Лучшая цена», «Предложение недели», «Финальная цена», «Товар дня» и на услуги. Внимание! Для использования промокода необходимо авторизоваться в клубной программе «Спортмастер».
6. ВкусВкусВилл. Актуальные промокоды ВкусВилл Доставка (до 31.10):
VS992F - скидка 200 руб. на первый заказ от 1 000 руб.;
5V9793 - скидка 350 руб. на первый заказ от 2 500 руб.
Акция доступна для новых клиентов по всей России на сайте и в мобильном приложении, которые ранее никогда не делали заказ на доставку из магазинов ВкусВилл, а также никогда не вводили промокод в приложении или на сайте. Скидка по промокоду суммируется со всеми акциями и спецпредложениями.
Скидка 1000 рублей на первый заказ от 2000 рублей - pfsht18228
Скидка 500 рублей на первый заказ от 2000 рублей - pfshc44949
Скидка 2000 при заказе от 5000 для новых пользователей - pfshr48183 Исключение: Смартфоны, товары продавцов Сбермаркет, товаров продавцов Самокат, наушники бренда Apple, бренд Rieker, товары из категории "Алкоголь"
Kari
Скидка на все 8% knb277329
Лента
Скидка 400р на любой заказ от 2000р, суммируется с акциями - LENT4138
Скидка 25% на первые 2 заказа от 1800р + 3 бесплатных доставки - LETO7699
Скидка 500р на первые 3 заказа от 1800р, суммируется с акциями - VKUS4036
Яндекс Еда Рестораны
Скидка 20% при заказе от 900р - qk9f5rn2
Скидка 300р при заказе от 900р - qfrh25xb
Яндекс Еда Магазины
Скидка 500р при заказе от 1500р - nhv6itk0
Скидка 35% на заказ от 900р - kbdl9l7t
Скидка 37% на товары для школы в Комус на первый заказ в разделе магазины - kcdes5gu
Маркет Деливири рестораны
Скидка 400р на первый заказ от 999р - TJDEU1V5
Маркет Деливири магазины
Скидка 35% (не более 2000 Р) на первый заказ из любого магазина, кроме "Верный" - TUCEQ9XA
Скидка 530Р на первый заказ от 1500р - TV9RZQRM
ВкусВилл Доставка
Скидка 300р на первый заказ от 1500р - 3V774A
Скидка 200р на первый заказ от 1000р - VS6FFB
Скидка 350р на первый заказ от 2500р - 5V6598
Скидка 450р на первый заказ от 2 200р - 45V8764
Premier
Бесплатный период на 30 дней - c49epmq7
Start
Бесплатный период на 30 дней - sh18301
Папа Джонс
Пицца 23 см в подарок от 1599р - 8xs5ykd в Королево, Люберцы, Москва, Одинцово, Коммунарки, Видное
Скидка 30% на заказ от 2500 - nkfkr9u в Королево, Люберцы, Москва, Одинцово, Коммунарки, Видное
СитиДрайв
Первая поездка за 1 рубль на чек не более 600 рублей - SHRRY444