Дубликаты не найдены

0
Любой ребенок в нежном возрасте очень сильный эмпат. Они чувствуют и понимают всё - так задумано природой.
0
@0x00, я буду преследовать тебя, пока не пообещаешь, что пикабу серьезно подумает на тему распознавания:D и даже такой шрифт распознается хорошо во всяких онлайн-сервисах(что не показатель, естественно), хотя и не самый популярный в длиннопостах)
@moderator, тысячепервый баян. http://pikabu.ru/story/deti_o_lyubvi_sciencepsychology_53096...
Иллюстрация к комментарию
раскрыть ветку 3
0
Не!Я действительно не знал!Извините...
раскрыть ветку 1
0
попроси 0x00 запилить ocr для баянометра, а пока можно искать через гугл или вставлять сам текст вот здесь и таким образом проверять его на уникальность.
Иллюстрация к комментарию
0
Привет =)
Есть ряд причин, по которым данная тема пока что не рассматривается:
1. На пикабу постят картики, в которых очень часто содержится текст (мемы, длиннопосты и др). Не весь текст из картинкок нужно искать по базе текстовых постов. Как определять, какой текст искать, а какой нет? Если на картинке будет просто слово "привет", то будет обнаружено сотни таких текстовых постов.
2. Задача обнаружения текста в картинке произвольного оформления, сжатия, шрифта и др, достаточно не тривиальная. Сторонний софт, как правило, ориентируется на сканы документов, а не на случайную картинку из интернета. Также появляется вопрос стоимости такого софта или, если он бесплатный, его лицензии на использование в коммерческом продукте.
3. Самое важное. Нагрузка. Новый поиск мы разрабатывали с учетом того, что за 1 день он будет запускаться десятки тысяч раз по базе из более 2 млн картинок. Если к нему ещё допилить обнаружение текста, то сервера просто лягут. Нужно будет заказывать новые мощности, которые стоят не так дешево.
Похожие посты
Возможно, вас заинтересуют другие посты по тегам: