Пытаться распознать надписи для корректной работы баянометра

На Пикабу достаточто обширна категория постов со смешными объявлениями или надписями. Думаю, для удобства поиска по ним, стоит пытаться автоматическими алгоритмами распознать текст. Зачем это нужно:
- чтобы вписать в атрибут alt тега картинки, и таким образом позволить находить данные посты поисковикам.
- чтобы при попытке поста с аналогичным текстом, пусть и сфотографированным другим человеком, или в другом месте - баянометр не молчал.

Качество распознавания особо не критично, пользователи этого не увидят. Распознанное стоит проверить по словарям, и исключить из найденного текста то, что не на русском. Оставить только словарные слова. Так будет достигаться идентичность найденного на разных фото.

Отзывы и предложения по Пикабу

13.2K пост2.7K подписчиков

Добавить пост

Правила сообщества

Сообщество для аккумуляции всего фидбека по Пикабу


Если вы предлагаете новую функцию, опишите подробно:

- Задачу, которую выполняет предлагаемое изменение;

- Возможные плюсы и минусы;

- Версию Пикабу, для которой делаете предложение.


Пожалуйста, имейте в виду, что предложение:

- Должно быть полезным, понятным и простым;

- Должно быть востребованным пикабушниками;

- Не должно создавать визуального нагромождения.