Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
#Круги добра
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Погрузись в Свидания с отличиями — романтическую игру «поиск отличий», где ты встречаешь девушек, наслаждаешься захватывающими историями и планируешь новые свидания. Множество уровней и очаровательные спутницы ждут тебя!

Свидания с отличиями

Казуальные, Головоломки, Новеллы

Играть

Топ прошлой недели

  • SpongeGod SpongeGod 1 пост
  • Uncleyogurt007 Uncleyogurt007 9 постов
  • ZaTaS ZaTaS 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
7
ElectricEeler
ElectricEeler
2 года назад
Программы и Браузеры

Нестандартное использование поиска по картинкам для распознавания текста⁠⁠

Так получилось, что под конец года приходится очень часто работать с электронными копиями документов. Хорошо, если его присылают в редактируемом формате, но к сожалению, это далеко не всегда так. Чаще всего это сканированная копия документа, а то и вовсе фото на смартфон.

Поделюсь сегодня как я использую сервис поиска по изображениям, предоставляемый Яндексом для оперативного распознания текста. Это очень удобно, быстро, бесплатно, всегда под рукой и самое главное качество распознавания на уровне хороших OCR систем. Так что студентам, офисным работникам мне кажется будет крайне полезно.

ВАЖНО! Я не знаю технических тонкостей работы сервиса и его особенностей хранения данных, поэтому не загружайте и не распознавайте документы, содержащие информацию ограниченного доступа - коммерческую тайну, персональные данные и прочее! Помните - все что однажды попало в интернет, остается там навсегда!

Итак, у меня есть два документа с просторов Интернета в формате jpg (фотография договора, сделанная судя по всему на смартфон) и в формате pdf (качественный текст). Процесс распознавания текста в обоих случаях будет идентичный. Но для pdf документа нам понадобится дополнительно его разобрать на картинки.

Нестандартное использование поиска по картинкам для распознавания текста Яндекс, Текстовый редактор, Редактирование, Распознавание, Ocr, Длиннопост

Заходим на сайт https://ya.ru/ и в поисковой строке жмем пиктограмму с изображением фотоаппарата.

С помощью открывшегося проводника выбираем изображение на котором есть текст, который требуется распознать. Подтверждаем открытие картинки. Получаем результат.

Нестандартное использование поиска по картинкам для распознавания текста Яндекс, Текстовый редактор, Редактирование, Распознавание, Ocr, Длиннопост

Имеем:
- поисковая строка с загруженным изображением
- предпросмотр самого изображения

- результаты поиска с сайтами где встречается похожее изображение

- справа поисковые хэштеги и самое главное поле с текстом на изображении.

Поздравляю страница распознана, текст можно скопировать в редактор и работать с ним дальше.
Дополнительные операции с документом в формате pdf

Загрузить документ целиком не получится. Нам надо взять pdf документ и разобрать его по отдельным страничкам. Тут вариантов множество:
- программы-конвертеры для вашей операционки

- графическим редакторы (например бесплатный GIMP)

- онлайн-сервисы (их множество, выбирайте на свой вкус и цвет).

Я покажу как разобрать документ с помощью онлайн-сервиса https://pdftoimage.com/ru/ , но повторюсь еще раз вы можете выбрать любой другой, наверняка шаги будут точно такие же.

Нестандартное использование поиска по картинкам для распознавания текста Яндекс, Текстовый редактор, Редактирование, Распознавание, Ocr, Длиннопост

Переходим в сервис и жмем кнопку "загрузить".

В проводнике выбираем необходимый pdf документ.

После загрузки файла, сервис автоматически начинает работу с ним.

После завершения разбиения файла, становится доступна кнопка "скачать все".

Жмем её, и скачиваем себе zip архив. Распаковываем его и находим в папке наш исходный pdf документ, который разделен на отдельные jpg картинки - одна страница = одна картинка.

Ну вот и все - возвращаемся на шаг распознавания текста и подгружаем по отдельности каждую страницу с текстом и распознаем.

Нестандартное использование поиска по картинкам для распознавания текста Яндекс, Текстовый редактор, Редактирование, Распознавание, Ocr, Длиннопост

Само собой качество распознавания в обоих вариантах будет очень сильно зависеть от качества исходного изображения, но в любом случае это очень удобно, так как не требует установки какого-либо стороннего программного обеспечения, бесплатно и быстро.

Всем спокойной работы и никаких дедлайнов!

Показать полностью 4
[моё] Яндекс Текстовый редактор Редактирование Распознавание Ocr Длиннопост
4
1
SubstrataStation
SubstrataStation
2 года назад

Пикабу, Mayday-Mayday!⁠⁠

Нужен текстовый редактор(Не прога! Живой! Прямоходящий!), человек, который поправит орфографию, ибо после большого колличества текста дико мылится глаз, в упор не замечаю ошибки. Не срочно. Мне просто необходимо знать, что есть надежный человек.
Работа: Краткие фантастические рассказы.
При отклике дам ссылку на файл, по цене договоримся.

«..Когда заблудишься в трех соснах – свободу видишь только в звездах. И я смотрел на них до тех пор, пока небесная панорама не стала казаться огромным космическим кратером усыпанным миллиардами белых углей. Надо мной нависал блестящий бескрайний колодец, будто бы небо являлось дном мироздания. От самых стоп по моим ногам поднимался свинец, меня порализовало от страха, когда стал чувствовать, что сейчас упаду вверх, в эту холодную пугающую бездну. Горло мгновенно пересохло, глаза горели, я рад был осесть в этот момент, чтобы ближе прижаться к металлу вагона, но не мог пошевелиться, больше не чувствовал ничего. Вся древность моих генов пыталась выдавить из меня рёв испуганного первобытного существа внутри, которое тысячилетия назад пряталось от этого кошмарного зрелища в пещеру, боясь даже зажечь огонь, чтобы не увидеть в нем белый звездный свет языков пламени. От гула в ушах больше не слышал как дышу, от жара варился в собственном костюме, пьяное слезное зрение смазывало проклятые звезды, а облако в этот момент медленно уплывало, открывая невиданную человечеству ранее фазу луны, ложно схожую с черной дырой. Очередная волна дрожи пробежала по телу при виде большого тонкого ободка белого звездного цвета, сквозь центр которого проглядывалась темнота космоса. Громадное неоновое кольцо сияло во всей красе, а звездный фон обрел еще большую видимость углубления....»

Пикабу, Mayday-Mayday! Сила Пикабу, Текстовый редактор, Рассказ, Литература, Научная фантастика, Помощь
Показать полностью 1
[моё] Сила Пикабу Текстовый редактор Рассказ Литература Научная фантастика Помощь
43
memesince
memesince
2 года назад
Юмор для всех и каждого

Я ошибка...⁠⁠

Телеграм — Мемуары ценителей научных мемов

Я ошибка... Юмор, Мемы, Картинка с текстом, Ошибка, Текстовый редактор
Юмор Мемы Картинка с текстом Ошибка Текстовый редактор
1
desmors
desmors
2 года назад

А теперь давайте серьезно⁠⁠

Рассказываю историю, году в 2007 мне купили первый комп бу с рук. Все казалось бы нормально играл себе в игрушки, но потом я заметил один текстовый файл. Зашел первый раз там был какой то невнятный текст не помню уже что было ну я на первый раз забил закрыл и все.
потом захожу туда в другой раз там другой текст, и он менялся через какойто промежуток времени я малой был не могу точно сказать сколько.
В целом там были достаточно криповые текста.

Вопрос такой были ли в 2007 какие то вирусы или нейросети которые могли сделать подобное генерировать текста.

А теперь давайте серьезно Голос, Разное, Компьютер, Нейронные сети, Текстовый редактор, Вирус, Компьютерный вирус, Windows
[моё] Голос Разное Компьютер Нейронные сети Текстовый редактор Вирус Компьютерный вирус Windows
12
DELETED
2 года назад

Пост1⁠⁠

1

[моё] Картинка с текстом Текстовый редактор Текст
3
39
Denitaliano
Denitaliano
2 года назад

Post-обработка текста в Word⁠⁠

Спойлер для ЛЛ:
^l - перенос строки без начала нового абзаца (клавиша "Shift + Enter")

^p - перенос строки с нового абзаца (клавиша "Enter")

^k - разрыв страницы (клавиша "Ctrl + Enter")


Решил поделиться своими знаниями о post-обработкt текста в Word после сканирования и распознавания. Как оказалось, нынешний интернет об этом не помнит, да и среди моих знакомых никто об этом не знает. Вот решил поделиться знаниями, которые могут быть утрачены ))))
Когда-то давным-давно более 20 лет назад  вначале моей трудовой карьеры мне приходилось сканировать много текстов и распознавать их. Я вот тут писал как-то про свой сканер #comment_221114674
В общем, сканировал во всю тексты. Ладно бы если это были страница формата А4, напечатанные на лазерном принтере. Но нет - это были ОСТы, РТМы (с разными грифами), напечатанные на пишущей машинке, ну и в лучшем случае книги. Распознание таких документов оставляло много артефактов, которые приходилось убирать руками - множество пробелов, разбиение документа на страницы под каждый новый абзац или перенос строки без начала нового абзаца.

Пробелы я быстро научился убирать автозаменой - в поле "Найти" ставим два пробела, в поле "Заменить" ставим один пробел. За несколько итераций убираем в тексте все лишние пробелы.
А вот для других артефактов я нашел вот такой способ:
^l - перенос строки без начала нового абзаца;

^p - перенос строки с нового абзаца;

^k - разрыв страницы;


Пример замены переноса строки 
Post-обработка текста в Word Текстовый редактор, Microsoft Word, Распознавание

Пользуйтесь )))

Я еще много всяких интересных штук умею. Вот, например, может кто-нибудь так выделить текст? А?

Post-обработка текста в Word Текстовый редактор, Microsoft Word, Распознавание
Показать полностью 2
[моё] Текстовый редактор Microsoft Word Распознавание
21
188
AndreyFomin
AndreyFomin
3 года назад
IT-юмор
Серия ASCII Art - мои картинки и анимации из текстовых с

Танец на шесте в текстовом редакторе⁠⁠

Танец на шесте в текстовом редакторе
[моё] Текстовый редактор Пилон Танцы Анимация Гифка
19
7
DELETED
3 года назад

Аналог Ms Office, может, кому поможет⁠⁠

Так получилось что мне понадобилось замена Microsoft Office покопавшись в гугле я нарыл целую кучу различных аналогов: SoftMaker FreeOffice, RusOffice, OpenOffice 4, WPS Office,  МойОфис, Onlyoffice,  R7office (одно и тоже, только последний платный, и последующие тоже), Polaris, OfficeSuite.

Мне необходимо было открыть файл размером 9,5 мб., и форматом doc (файл заблокирован для редактирования). Смысл в том, чтобы было сохранено правильно форматирование изображений и текста. Но самое удивительное что сам Microsoft Office Online, криво открывает! Хотя файл создан офисе!

С этой задачей справился только OpenOffice и WPS Office. RusOffice не смог открыт файл вообще, все остальные открывали но всех страдало форматирование, хотя МойОфис почти смог :) LibreOffice не проверял у меня к нему личное отторжение.

[моё] Windows Софт Microsoft office Компьютер Текстовый редактор Текст
9
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии