Бинго капча
И ведь оказалось, что неправильно!
И ведь оказалось, что неправильно!
А как можно обучать нейросеть, если ответы не всегда правильные? И как определять правильно ли пользователь выбрал? Может, наоборот, уже обученная нейросеть проверяет пользователя?
При помощи статистики выделяют те ответы, которые выбирают сильно чаще других. При аудитории гугла, можно пренебречь тем, что все сговорились и выбирают не то.
1. У гугла невероятное количество уже определенных котиков/автобусов. То, что туда большими усилиями впихнут небольшое количество собачек/светофоров, мало повлияет на обучение нейросети. У них всегда есть какой-то небольшой процент ошибки.
2. У гугла есть и полностью разгаданные картинки, у которых подавляющее большинство выбрало один очень и которые ничем не отличаются от неразгаданных. И он отлично умеет определять, что это один и тот же пользователь. Так что вредителя можно довольно спокойно опередилить и исключить из обучения нейросетки. Ну или подсовывать ему старую капчу, на разгадывания слова.
3. К тому же, что большая часть пикабу сконцентрирована в ex-СССР, а капча совершенно спокойно показывается всему остальному миру. Если очень хочется, то можно одну картинку показывать в определенной группе людей (регион, возраст, пол и т.д.) только ограниченное количество раз, тогда те, кто сговорился, не смогут сильно повлиять на средний ответ.
Конечно можно избежать идентификации при помощи тора или что больше нравится, но сам факт использования тора тоже можно определить: несколько пользователей с одного ip и совершенно разными интересами, несоответствие страны интересов и страны ip, у всех браузер, в котором ничего не доступно для определения, большой пинг. Всё это выдает очень подозрительного пользователя, которому не стоит верить.
Не только.
Идёт распознавание Google Street, самими людьми, выполняем функцию описания (каталогизацию) объектов. Нейросеть давно бы уже обучилась, таких капчей разгадано уже миллиарды. Вероятно нейросеть учится определять правильно ли отвечаем или нет.
Уже лет подобные 5 капчи разгадываем. Раньше книги оцифровывали подобным способом, капча с фрагментом текста.
Да хрен с теми, кто придумал! Неужели разрабы сайтов реально не видят, что люди мучаются и не могут войти на сайт? Или им лишь бы сделать?
Пытаешься зайти с тора, а тебе выдают эту капчу, которую практически невозможно пройти. А если всё-таки прошёл, не проблема - на следующей странице тебя встречает то же испытание ещё раз.
Хорошо, что есть Disconnect и DuckDuckGo.
Чтобы администрация сайтов не могла тебе идентифицировать по IP или фингерпринту браузера. А зачем это - у каждого своя причина.
А я о "тех кто покруче" ничего и не говорил. Чёрным по белому написал - "администрация сайтов". Не ФСБ с Интерполом.
Ебать жеж вы эксперт сударь, позвольте внести поправочку. Никакие логи в торе никуда не пишутся, но ретрансляторы (обычные узлы сети интернет, не торовские ретрансляторы) могут быть под контролем спецслужб и потенциально на них может быть прошивка/по которое пишет логи. Логи отображают с какого на какой IP и когда были переданы данные через ретранслятор. Отследить это можно не по IP адресу, а по времени - если в 14:00 появился пост о чем-то нехорошем в интернете то берутся все IP выходных нод тора (это открытый список), которые передавали данные на сервер за последние 15 секунд до появления поста, оттуда дальше берётся список всех кто передавал данные за 5 секунд до этого на выходную ноду, потом 5 секунд по предыдущим нодам которые передавали на ноды которые передавали данные на выходную году, и т. д. раз 10. Получается набор из 50000 IP адресов. Когда автор размещает второй пост - проводится такая же проверка, полученные результаты накладываются и остаётся общих 100 IP со всех цепочек. После третьего раза допустим 15. 15 домов прочесать SWAT'ом не проблема) Росса Ульбрихта, основателя Silk Road в торе, так и вычислили. Каждый месяц он постил что его ещё не поймали и можно биржа в безопасности. За 5 вышеописпнных итераций по IP удалось узнать имена и поставить за всеми слежку
Он один на всех пользователей тора, и если на сайт с тора ходит много людей, то отличить одного от другого невозможно.
Прикол капчи не в том, что её долго разгадывать. Это наоборот плохо на самом деле.
Если 100 роботов начнут параллельно разгадывать долгую капчу, то они просто с некоторой задержкой её пройдут. Запустите их не все разом, а по очереди, тогда они и атакуют сайт большой волной, просто через некоторое время.
Цель капчи в том, чтобы роботы вообще её не смогли разгадать за разумное время.