Помогите распознать текст! Номера купюр
Прошу помощи! Имеется PDF файл из 180 листов. Каждый лист имеет примерно такой вид. Надо вытащить номера (желательно и серию) денежной купюры из каждой. Черно-белая ксерокопия денег. Таких купюр много. Прошу помощи. Оплачу, если кто сделает это в виде текстового файла.
Нестандартное использование поиска по картинкам для распознавания текста
Так получилось, что под конец года приходится очень часто работать с электронными копиями документов. Хорошо, если его присылают в редактируемом формате, но к сожалению, это далеко не всегда так. Чаще всего это сканированная копия документа, а то и вовсе фото на смартфон.
Поделюсь сегодня как я использую сервис поиска по изображениям, предоставляемый Яндексом для оперативного распознания текста. Это очень удобно, быстро, бесплатно, всегда под рукой и самое главное качество распознавания на уровне хороших OCR систем. Так что студентам, офисным работникам мне кажется будет крайне полезно.
ВАЖНО! Я не знаю технических тонкостей работы сервиса и его особенностей хранения данных, поэтому не загружайте и не распознавайте документы, содержащие информацию ограниченного доступа - коммерческую тайну, персональные данные и прочее! Помните - все что однажды попало в интернет, остается там навсегда!
Итак, у меня есть два документа с просторов Интернета в формате jpg (фотография договора, сделанная судя по всему на смартфон) и в формате pdf (качественный текст). Процесс распознавания текста в обоих случаях будет идентичный. Но для pdf документа нам понадобится дополнительно его разобрать на картинки.
Заходим на сайт https://ya.ru/ и в поисковой строке жмем пиктограмму с изображением фотоаппарата.
С помощью открывшегося проводника выбираем изображение на котором есть текст, который требуется распознать. Подтверждаем открытие картинки. Получаем результат.
Имеем:
- поисковая строка с загруженным изображением
- предпросмотр самого изображения
- результаты поиска с сайтами где встречается похожее изображение
- справа поисковые хэштеги и самое главное поле с текстом на изображении.
Поздравляю страница распознана, текст можно скопировать в редактор и работать с ним дальше.
Дополнительные операции с документом в формате pdf
Загрузить документ целиком не получится. Нам надо взять pdf документ и разобрать его по отдельным страничкам. Тут вариантов множество:
- программы-конвертеры для вашей операционки
- графическим редакторы (например бесплатный GIMP)
- онлайн-сервисы (их множество, выбирайте на свой вкус и цвет).
Я покажу как разобрать документ с помощью онлайн-сервиса https://pdftoimage.com/ru/ , но повторюсь еще раз вы можете выбрать любой другой, наверняка шаги будут точно такие же.
Переходим в сервис и жмем кнопку "загрузить".
В проводнике выбираем необходимый pdf документ.
После загрузки файла, сервис автоматически начинает работу с ним.
После завершения разбиения файла, становится доступна кнопка "скачать все".
Жмем её, и скачиваем себе zip архив. Распаковываем его и находим в папке наш исходный pdf документ, который разделен на отдельные jpg картинки - одна страница = одна картинка.
Ну вот и все - возвращаемся на шаг распознавания текста и подгружаем по отдельности каждую страницу с текстом и распознаем.
Само собой качество распознавания в обоих вариантах будет очень сильно зависеть от качества исходного изображения, но в любом случае это очень удобно, так как не требует установки какого-либо стороннего программного обеспечения, бесплатно и быстро.
Всем спокойной работы и никаких дедлайнов!
Распознавание текста с помощью pytesseract
Если вы столкнулись с задачей распознавания текста, то в первую очередь необходимо обратить внимание на так называемые OCR-библиотеки. Вообще OCR (Optical Character Recognition) - это оптическое распознавание текста, то есть механический или электронный перевод изображений с текстом в текстовые данные. То есть формально, когда вы перепечатываете какой-либо текст, то реализуете один из механизмов OCR :)
Нас конечно же интересует чтобы программа сама смогла прочитать текст с картинки и предоставить текстовые данные в строковой переменной. Для этого существуют различные готовые библиотеки и одна из них - Tesseract. Сама библиотека Tesseract не имеет ничего общего с Python, по сути она содержит OCR-движок и программу командной строки. Поэтому для разработки на Pyhton нам потребуется специальный модуль pytesseract.
Перед тем как я начну использовать pytesseract, необходимо провести подготовительную работу. Так как у меня на компьютере Linux, мне нужно загрузить ряд пакетов чтобы начать разработку распознавалки текста.
Для этого в командной строке необходимо выполнить:
$ sudo apt update
$ sudo apt install tesseract-ocr
$ sudo apt install libtesseract-dev
Этого достаточно чтобы распознать текст на английском языке, но моя цель - распознавание текстов на русском языке, поэтому потребуется поставить ещё один пакет:
$ sudo apt install tesseract-ocr-rus
У библиотеки Tesseract много языковых пакетов, поэтому если вам требуется возможность распознавать какой-либо другой язык, то выполняете команду:
$ sudo apt install tesseract-ocr-[lang]
где вместо [lang] указываете название языка в сокращённом виде: https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html
А можно просто выполнить команду:
$ sudo apt install tesseract-ocr-all
и у вас будет поддержка всех языков, которые умеет распознавать Tesseract.
Я правда не разбирался как всё тоже самое провернуть в Windows, но если вам это интересно, напишите пожалуйста к статье комментарий или мне в личные сообщения - я дополню статью. А пока продолжаем работу в Linux :)
Теперь нужно создать новый проект в IDE и настроить виртуальное окружение. Для распознавания текста необходимо поставить библиотеку pytesseract, как я уже писал выше, а так же потребуется pillow для загрузки изображений. Поэтому выполняем следующие команды:
pip3 install pytesseract
pip3 install pillow
Теперь у нас есть всё необходимое чтобы приступить к разработке приложения, которое будет распознавать текст.
Само приложение будет максимально простым, ведь вся работа ложится на установленные библиотеки. Мне остаётся только написать несколько строчек чтобы всё заработало:
Вот и весь код! Единственный важный момент - нужно явно указывать язык при вызове метода image_to_string, так как библиотека не умеет самостоятельно определять язык, на котором написан текст.
Теперь попробуем распознать вот такую сложную по своей структуре страницу:
Запускаем программу и получаем следующий результат:
Не идеально конечно, но с учётом того что структура страницы сложная, качество изображения плохое и часть букв смазаны, то результат вполне себе хороший! Тут стоит вспомнить что даже старый добрый FineReader так же допускает ошибки при распознавании текста.
Современным разработчикам очень повезло - уже существуют множество готовых библиотек с очень серьёзными возможностями. Ещё лет 15-20 назад для решения подобной задачи пришлось бы потратить гораздо больше времени и скорее всего пришлось бы писать свой OCR-движок. Теперь достаточно написать несколько строчек кода чтобы получить на выходе достойный результат!
Влюбленный нарцисс: как распознать
Если бы я только знала, что он нарцисс….
Такую фразу можно услышать от девушек, когда они сокрушаются на тему того, что раньше не разглядели абьюзера. На самом деле есть как минимум 3 признака, которые можно заметить еще в начале отношений. Да, сложно, ведь на глазах розовые очки, но все-таки можно.
Родная душа
Нарциссы — искусные манипуляторы. Они быстро определяют потребности и слабые места человека и бьют именно туда. Вы сомневаетесь в своей привлекательности? Нарцисс засыплет вас комплиментами. Вы устали на работе? Он расскажет вам свою историю о том, как ему все надоели и как он понимает вас. Вы мечтаете прыгнуть с парашютом? Оказывается, он тоже всегда мечтал об этом. С каждой минутой вы все больше удивляетесь: ну, надо же, как мы похожи. А нарцисс в это время придумывает новые истории, сканирует вас и подстраивается под вас.
Эффектный выход
Нарцисс — мастер красивых ухаживаний, эффектных появлений и признаний в любви. Наверняка, у вас промелькнет мысль: «Так со мной еще никто не обращался — как с принцессой». На самом деле нарцисс делает это для того, чтобы вы поддались эмоциям, а ваше критическое мышление ослабло.
Спешка
Он спешит познакомиться со всеми вашими друзьями и родными (потом будет понемногу изолировать вас от них). Вы только что познакомились, а он уже строит планы на будущее. И на первом свидании он признается в любви. Замуж зовет через быстро, максимум через 2 месяца.
Отнять имя = отнять личность
Нарцисс не был бы нарциссом, если бы с первых дней знакомства не начал обесценивать. И это проявляется не только в том, что он, к примеру, не хочет радоваться за вас или в пол уха слушает о том, что происходит у вас в жизни. Это проявляется еще и в том, что он меняет ваше имя. И часто речь идет даже не об имени, а о каком-то абстрактном прозвище. Нарцисс видит в людях ресурсы, но, конечно, он не скажет об этом. Поэтому придумывает ласковое прозвище, которое еще больше усыпляет бдительность. Например: моя королева, богиня, счастье, радость.
Забота
Нарцисс не сразу становится жестоким и контролирующим. Сначала он будет очень заботливым. Он обязательно спросит, что и когда вы ели, по погоде ли одеты, не обижает ли вас кто-то и т.д. На самом деле это первые попытки контролировать вас и вашу жизнь, но пока приправленные соусом «милоты». Но стоит вам взбрыкнуть, и вы услышите первые нотки не довольства. В начале это может звучать так: «Дурочка, я же о тебе забочусь». Со времен это превратить в просто «Дура!».
Как вы, возможно, догадались, «влюбленный нарцисс» — это образное выражение.
Нарцисс не способен на истинную любовь, поэтому он никогда не будет заботиться об избраннике, интересоваться его жизнью и развитием. Он ищет того, кто будет крутиться вокруг него, жить им, отдавать себя без остатка. В отношениях его всегда будет много, а вас — мало. И ощущение «что-то не то» не захочет покидать вас.
Чтобы не попасть в ловушку, постарайтесь все-таки мыслить разумно. Обратите внимание на то, как нарцисс ведет себя с другими людьми. Если вы для него Богиня (по его словам), а остальных людей он ни во что не ставит, то это повод задуматься.
Много бесплатной информации по этой теме вы можете найти в моем Телеграм https://t.me/ToxParents
Поиск программы для распознавания голоса
Пару лет как стал записывать рассказы прабабушки жены на телефон. Ей уже 92 года - не успею записать, потом разве что вспоминать придётся - а много ли вспомнишь? Очень жалею, что в своё время не записывал рассказы мамы и отца про войну, про оккупацию - боюсь, что уже половину рассказов не вспомню. Нет, наверное вспомню, но много подробностей будет уже потеряно.
Так вот, у меня вопрос. Я знаю, что есть программы для распознавания голоса, есть и онлайн. Меня не забанили в гугле, я их находил, но хотелось бы получить реальные отзывы, какие хорошие, какие не очень. Наверняка кто-нибудь на пикабу занимался распознаванием.
Просто если печатать на слух -то получается очень долго и муторно.
Ответ на пост «Учебник по геометрии для слепых»
Здравствуйте!
А как тогда можно говорить про такой инструмент распознавания записей по системе Брайля, под названием "Angelina Braille Reader?"
Ведь этот сайт создавался для облегчения распознавания шрифта Брайля. Данное удобство для учителей создавалось и других людей, чтоб облегчить проверку записанного учеником или другим незрячим человеком.
При необходимости можно при помощи планшетного сканера отсканировать записи шрифтом Брайля. Потом зарегистрироваться на данном сайте, чтоб распознать информацию. Но можно без регистрации, тогда, у Вас, не будет сохраняться история раннее отсканированных и переведенных записей из шрифта Брайля.
Можно при помощи смартфона, тогда лучше делать тому человеку, кто хорошо делает фотографии на смартфоне, чтоб меньше погрешностей в фотографии было, а сканер как раз позволяет без погрешностей отсканировать документ.
Предупреждаю сразу, если будет перекол или недокол, тогда текст будет нести другой смысл записи. Даже затертые точки способствуют созданию другого смысла записи.
Конечно, если я правильно объяснил записанное выше.
Думаю, @Sehvana, примерно понимает о чем идет речь, и может быть попадалось ей в работе такой приложение и сайт?
Даже сам сканировал работу один раз для проверки сайта и приложения.
Распозналось нормально, но огрехи в документе были от недокола или перекола точек по системе Брайля.
Система Брайля- рельефно-точечный шрифт используется для записи и чтения информации незрячими и слабовидящими людьми.
Интересно, приподаватель будет пользоваться проверкой записей по системе Брайля, если сам захочет освоить работу с данным приложением, а так оно простое по своему использованию вообще и инструкция там имеется для работы.
Вот такой короткий постик от меня.
Всего хорошего!
Помогите распознать ремень для стиральной машины
Это все, что осталось. Номер должен быть другим. Если маркировка иная, как в моем случае, то тут уже поможет житейский опыт.
Размеры роликов для примерного понятия. Точнее замерить не смог, к сожалению. Рулетку завтра куплю.
Что вы думаете об онлайн-курсах? Поделитесь мнением!
Онлайн-курсов становится все больше, и нам интересно собрать статистику, чтобы лучше понимать запросы читателей Пикабу.
Пожалуйста, поделитесь своим мнением!