user9638954

На Пикабу
100 рейтинг 0 подписчиков 0 подписок 3 поста 0 в горячем
0

Распознавание капчи токеном vs кликами: сравнение скорости решений

Я часто сталкиваюсь с различными инструментами, которые облегчают работу в разных областях. Сейчас речь не о таких сервисах, как Key Collector или Ahrefs, а о Zennoposter или BAS. Я не эксперт в автоматизации, но понимаю, что эти сервисы представляют собой сложные многоуровневые оболочки. На их основе можно создавать любые боты и скрипты, способные выполнять практически любые задачи без участия человека. Это своего рода нейросети в упрощенном виде. Интересно, что подобные сервисы появились задолго до того, как использование нейросетей в повседневных задачах стало массовым явлением.

Перейдем к сути: исследуя возможности BAS, я заметил, что многие разработчики скриптов для этого сервиса идеализируют распознавание капчи методом кликов.

Поясню: речь идет о графических и визуальных капчах, где нужно выбирать изображения на экране или кликать по иконкам в определенном порядке. Примеры таких капч: reCAPTCHA V2, hCaptcha, GeeTest CAPTCHA, Rotate CAPTCHA.

Эти капчи можно обойти двумя способами: с помощью токенов и методом кликов.

Если хотите глубже разобраться в методах распознавания капчи, рекомендую отличную статью: "Распознавание капчи – разбираемся в сложном для понимания процессе максимально просто".

Возвращаясь к вопросу об идеализации метода кликов среди разработчиков скриптов для BAS, стоит отметить, что этот метод действительно может быть проще в реализации и интеграции (спойлер - нет, он не проще). Для его внедрения может быть меньше препятствий со стороны сервисов капчи, которые их разрабатывают. Однако мой опыт показывает, что решение капчи с помощью токена быстрее и эффективнее, чем методом кликов.

Теперь к фактам:

Имеется демо-страница reCAPTCHA V2.

Задача: сравнить скорость распознавания капчи (в нашем случае reCAPTCHA V2) двумя методами.

В качестве основы взяты два расширения с GitHub (хотя хотелось использовать готовые версии, пришлось немного доработать под свои нужды).

Расширение для распознавания капчи с использованием Puppeteer: 2captcha-solver-in-puppeteer.

Расширение для распознавания капчи методом кликов (также с использованием Puppeteer): puppeteer-recaptcha-solver-using-clicks.

В принципе, сравнение можно было бы закончить на первом расширении, так как оно позволяет решать капчу и токеном, и кликами. Но поскольку результаты со вторым расширением были неоднозначными, я решил его тоже включить для более наглядной демонстрации скорости решения капчи кликами.

Подготовка к распознаванию капчи (настройка распознавателя)

Опишу сразу все этапы подготовки распознавателя капчи, чтобы больше к этому не возвращаться.

Подготовка к распознаванию капчи токеном

Поскольку оба распознавателя капчи по умолчанию настроены на демо-страницы сервиса, который их разработал, я решил, что объективнее будет решать капчу на демо-странице Google. Там капча может быть сложнее, да и фактор предвзятости уменьшается.

Итак, в первом расширении для корректной работы и решения капчи токеном необходимо внести следующие изменения:

  • В файле config.js (находится в \2captcha-solver\common) убедиться, что напротив типа нашей капчи установлен метод token и в 4-й строке подставить ваш API-ключ (см. фото, возможно, со временем что-то изменится, нумерация строк приведена для примера).

  • В файле manifest.js (расположен на уровень выше предыдущего файла) необходимо удалить из кода следующие строки - код 1.

В файле index.js нужно изменить URL страницы с капчей (по умолчанию там указана демо-страница 2captcha; я заменил на демо-страницу Google).

Ниже, в этом же файле, нужно изменить строку:

await page.click("button[type='submit']")

На вот такую

await page.click('#recaptcha-demo-submit')

Это необходимо, чтобы решатель капчи смог найти кнопку "submit", так как классы на демо-страницах Google и 2captcha немного отличаются.

Важно отметить, что для использования этого распознавателя капчи в своих целях потребуется его доработать или хотя бы протестировать работоспособность.

Подготовка к распознаванию капчи кликами через первое расширение

Для решения капчи кликами через первое расширение необходимо внести следующие изменения:

В файле config.js в методе решения капчи выбрать click (место, где менять метод, описано выше). API-ключ остается тот же.

Я закомментировал часть кода в файле index.js, так как решатель капчи отказывался завершать решение, не находя кнопку. Мне было проще самому кликнуть на кнопку "submit", поэтому я закомментировал проблемный участок. Если вам нужно распознать капчу через это же расширение, потребуется его немного доработать.

Я закомментировал следующий код (строки с 25 по 37) - код 2.

В итоге код выглядит так - код 3.

Теперь расширение готово решать капчу кликами.

Подготовка второго расширения для решения капчи кликами

Здесь потребовалось немного больше усилий, но ничего сложного. Все файлы находятся в корневой папке, поэтому переходить по каталогам не нужно. Я добавил свой API-ключ, изменил URL страницы с Google reCAPTCHA и немного поработал с кодом, особенно с селекторами. На странице Google селекторы отличаются от селекторов на демо-странице 2captcha, поэтому расширение изначально не работало. Подробно расписывать изменения не буду, так как второе расширение представлено для ознакомления.

Если хотите поработать с ним, есть подробная статья: "Как обойти и автоматически решить reCAPTCHA с использованием Puppeteer".

Итак, все расширения готовы к тестированию. Запускаем!

Распознавание капчи токеном или кликами: что быстрее?

Я записал экран во время работы расширений при решении токеном и кликами и объединил их в одном видео. Перед тем как показать результаты, несколько замечаний:

  • Скорость распознавания капчи, ее сложность и другие факторы зависят от "заспамленности" вашего IP-адреса. Поэтому для быстрого решения капчи могут потребоваться прокси, которые также могут увеличить расходы.

  • Говорят, что с хорошими прокси можно вообще избежать необходимости обходить капчу, если она не стоит на странице по умолчанию.

  • В целом, хорошие прокси позволяют решать капчу быстрее. Я использовал свой домашний IP-адрес.

В первом случае я сравнил скорость распознавания Google reCAPTCHA в рамках одного расширения. Результат показал, что решение токеном быстрее и, вероятно, качественнее. Вы можете увидеть это на видео.

В итоге токен был решен за 18 секунд, а методом кликов — за 1 минуту 10 секунд. В дальнейшем мне даже удалось решить токеном еще быстрее, а вот ускорить решение кликами не получилось.

Для сравнения я проверил, как решает капчу кликами второе расширение. В целом ситуация повторилась: скорость решения была достаточно низкой, и дело не в сервисе распознавания капчи, а в выбранном методе. Сервис отдавал ответ быстро, что видно на скринкасте, но reCAPTCHA снова и снова просила повторить.

Примечание: я намеренно ускорил видео для второго расширения, так как капча была решена за 4 минуты.

Таким образом, для своих задач я бы предпочел метод токена, по крайней мере при использовании Puppeteer. С Selenium попробую разобраться в следующий раз.

Показать полностью 5
4

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

Капча – это не отдельное слово, которому можно дать определение, а целых девять слов (и два предлога) - Completely Automated Public Turing Test To Tell Computers and Humans Apart. Сократили это все до емкого CAPTCHA, чтобы не создавать очередное сложнопроизносимое слово. В переводе на русский эта аббревиатура звучит так - Полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей.

Не получается из этого набора слов КАПЧА, правда? Да это в принципе и не нужно, всем и так понятно о чем идет речь. Найди указанные картинки, или введи указанный текст, чтобы подтвердить что ты не робот.

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

Пройти капчу несложно, если ты человек. Сложнее, если ты человек с кучей аккаунтов, которые работают автономно (это называется автоматизация). Нужно использовать средства автоматизации, менять прокси, покупать отпечатки браузера и этот список можно продолжать долго, вариантов много.

И проблема в том, что универсального решения, как такового, нет. То есть, условный парсер, который собирает информацию с определенного сайта пишется под конкретный вид капчи, который в момент написания присутствует на сайте, и если на этом сайте обновляется капча, парсер перестает работать, вернее не так. Парсер при встрече с новой капчей перестает работать.

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

Получилось сумбурно… Попробую по-другому… Если ваш парсер может обойти reCAPTCHA V2 он не сможет обойти reCAPTCHA V3, так как это разные виды капчи, каждая из которых имеет свой набор уникальных параметров, которые необходимо учесть.

Уточнение — если в вашем парсере не заложены все методы решения, а только один, то вышесказанное работает.

И пример для самых маленьких – если вы попытаетесь протолкнуть в отверстие в форме кубика шар, он туда не пролезет. Так и тут…

Теперь давайте разберемся в видах капчи и что потребуется для того, чтобы распознать капчу.

Зачем и кому нужно обходить капчу и кто в этом помогает?

Довольно простой вопрос, для тех, кто понимает, о чем речь и более сложный для тех, кто не в теме. Казалось бы – сидит пользователь в интернете, хочет где-то зарегистрироваться или что-то скачать, выползла капча – он ее распознал и продолжил свою работу, все…

Для повседневного серфинга интернета эта информация абсолютно бесполезная, а вот для тех, кто решает задачи автоматизации, тестирует нагрузку на веб ресурсы, парсит данные и выполняет подобные задачи – разбираться в видах капчи важно, так как это экономит много времени.

Итак, обход капчи важен для:

Автоматизаторов (те, кто автоматизирует рутинные задачи, монотонное выполнение которых на некоторых ресурсах провоцируют появление капчи)

Тестировщиков (при настройке безопасности веб-ресурсов необходимо предусмотреть различные варианты, в том числе наплыв ботов, и чтобы защититься от этого в будущем, в настоящем необходимо этот наплав сгенерировать самостоятельно)

Разработчики скриптов или парсеров (сбор информации вручную занимает много времени, даже с собственных интернет-ресурсов, что уж говорить про конкурентов, а любой ресурс с информацией защищается от нагрузки, в том числе капчей)

Кто помогает в обходе капчи? Для самых крутых программистов не нужна ничья помощь, они в состоянии обучить собственные модели распознавать капчу либо будут использовать прокси (через перебор прокси можно добиться того, что капча совсем не будет появляться).

Что касается тех, кто не может или не хочет заморачиваться – тут на помощь приходят сервисы распознавания капчи. Они бывают нескольких видов:

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

Ручное распознавание обойдется дороже, но и точность распознавания тут стремится к 100% (ты понимаешь за что ты платишь), тогда как сервисы автоматического распознавания, наоборот могут быть дешевле, но и качество тут оставляет желать лучшего, при обходе сложных капч они могут быть и вовсе бесполезными. OCR  вообще предназначены для обхода текстовых капч и не справляются с капчами последнего поколения.

Теперь разберемся в видах капчи.

Распознавание капчи по видам и чем эти виды отличаются

Существует несколько видов капчи, которые различаются по степени сложности и количеству учитываемых факторов для ее прохождения.

Перечислять каждую капчу будет скучно и муторно, поэтому я попытался их классифицировать, вот что у меня вышло:

Картинные и визуальные капчи

  • reCAPTCHA V2

  • hCaptcha

  • GeeTest CAPTCHA

  • Rotate CAPTCHA

Поведенческие и невидимые капчи

  • reCAPTCHA V3

  • Cloudflare Turnstile

Текстовые капчи

  • Простая капча

  • Amazon CAPTCHA

Аудио капчи

  • Audio CAPTCHA

Иные интерактивные капчи

  • CyberSiARA

  • atbCAPTCHA

  • GeeTest CAPTCHA

  • MTCaptcha

  • Cutcaptcha

  • Tencent CAPTCHA

  • Lemin CAPTCHA

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

Картинные и визуальные капчи - обход капчи в картинках

В данном виде собраны топ 1 и топ 2 всех капч. Эти капчи стоят на 70-80% ресурсов и это reCAPTCHA V2 и hCAPTCHA. Да, принцип решения у них разный, но смысл действия примерно похожий

reCAPTCHA V2: Использует изображения, требует выбора объектов (например, машины), учитывает пользовательские действия (движения мыши, клики).

hCaptcha: Похож на reCAPTCHA, использует выбор изображений, анализирует клики и задержки.

Помимо стандартных наборов задач (необходимость кликнуть по определенному предмету или картинке, каждая капча анализирует поведение пользователей. И в каждом случае этот набор разный и приоритезация у этих факторов, также, может отличаться. Эти данные достоверно известны только самой компании, разрабатывающей защиту от ботов, а мы можем лишь строить предположения, оценивая значимость движений мышки или задержек.

Менее популярный вид капчи, который попал в этот подвид - Rotate CAPTCHA. Тут необходимо повернуть изображение в нужное положение. Капча учитывает точность манипуляций пользователя при решении капчи.

Поведенческие и невидимые капчи - решение капчи, которой не видно

Абсолютно иной вид капч, который использует анализ поведения пользователя без явного взаимодействия с ним. Но надо понимать, что невидимая часть капчи – это лишь верхушка айсберга, и в случае, когда система решит, что пользователь (бот) не проходит под параметры добропорядочного посетителя – ему будет предложено решить другой (видимый) вид капчи, а это может уже быть любая из перечисленных в статьей капча – текстовая ли, или интерактивная и т.д.

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

К невидимым относят:

reCAPTCHA V3: Анализирует действия на странице без прямого взаимодействия, присваивает оценку риска. Работает со score пользователя, присваивая его от 0 до 1, и в зависимости от того, что указал администратор либо пропускает юзера, либо продолжает его мучать дальше уже видимыми капчами.

Cloudflare Turnstile: Использует данные устройства и сети для проверки без вмешательства пользователя. Считается более сложной по сравнению с предыдущим видом, так как если невидимая часть капчи посчитала вас ботом, видимая часть будет намного сложнее.

Текстовые капчи - распознавание капчи практически даром

Самый простой вид капчи – текст, который необходимо ввести в указанное поле. Несмотря на простоту, в свое время эта капча имела несколько видов сложности. Учитывала пробелы или не учитывала, была чувствительна к регистру или нет, с цифрами или специальными символами и т.д. Но факт остается фактом, по сравнению с другими видами капчи обойти текстовую капчу очень просто.

Для того, чтобы обойти текстовую капчу использовались дешевые OCR сервисы. Почему использовались? Да просто текстовая капча уже редко где встречается и для ее обхода уже придумали кучу бесплатных решений, которые не требуют денег за распознавание.

Основной параметр, который учитывается при распознавании такой капчи – правильность ввода текста. То есть задача автоматизатора (если вдруг понадобиться автоматизировать распознавание текстовой капчи).

Однако, текстовая капча не хочет так просто сдаваться, и наличие тут Amazon CAPTCHA, тому подтверждение. Да, Амазон капча подобна простой капче, часто использует текст и цифры, но загвоздка в том, что эти цифры и текст искажены, и если системе что-то не понравится, уровень сложности будет повышаться, переключаясь с текстовой капчи на более продвинутые виды проверок.

Аудио капчи - обход капчи на слух

Изначально была разработана для удобства слепых людей, чтобы они могли пройти капчу, если система решит что пользователь подозрителен. Принцип работы Audio CAPTCHA - пользователь слушает аудио и вводит услышанный текст, учитывает точность распознавания звуков. Наличие аудио капчи позволяло обходить сложные виды капчи. То есть, пользователь (бот) просто переключался на аудио, транскрибировал его и проходил капчу.

Иные интерактивные капчи - когда распознавание капчи похоже на игру

Этот подвид капч включает в себя различные варианты капч, использующих нестандартные способы проверки, что вы человек. Они уже могут не иметь ничего общего с первоначальным тестом Тьюринга, а просто предлагают пользователю сложные и не очень задачки.

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто

CyberSiARA: Специальные задачи, такие как головоломки или выбор объектов, анализирует поведение.

atbCAPTCHA: Интерактивные задачи с манипуляцией элементами, учитывает точность действий.

GeeTest CAPTCHA: Основана на заданиях, таких как перетаскивание пазлов или других объектов. Система учитывает движение мыши, время реакции и поведение пользователя, чтобы определить, является ли он ботом. GeeTest активно адаптирует задачи в зависимости от подозрительности действий.

MTCaptcha: Использует задачки с выбором объектов и манипуляцией с изображениями, анализирует время взаимодействия и точность.

Cutcaptcha: Требует вырезать или переместить части изображения, учитывает точность движений.

Tencent CAPTCHA: Предлагает пазлы и задачи с перемещением, фиксирует точность и плавность действий.

Lemin CAPTCHA: Включает мини-игры и задачи по выбору объектов, анализирует поведение и время ответа.

Как распознать капчу каждого вида?

Конечно было бы слишком просто, если бы решить любую капчу можно бы было примерно одним и тем же способом. Я решил классифицировать капчи по способу их решения, вот что у меня получилось:

Решение капчи токенами

Используется для капч, где нужно получить специальный ответный токен для подтверждения. Суть решения проста, вы отправляете капчу для решения на сервис распознавания капчи, а они в ответ присылают вам токен, который вы подставляете в нужное место, после чего капча считается пройдённой.

К таким капчам относятся:

  • reCAPTCHA V2

  • reCAPTCHA V3

  • hCaptcha

  • Cloudflare Turnstile

Решение капчи текстовым вводом

Распознавание текста с изображения и ввод его пользователем, пользователь шлет сервису изображение капчи, а сервис ему в ответ текст, который (пользователь) он подставляет в нужное поле.

Сюда относятся:

  • Amazon CAPTCHA

  • Текстовая капча

Решение капчи координатным методом

Пользователь присылает сервису требуемые параметры, после решения капчи сервис отправляет пользователю координаты и порядок этих координат, которые необходимо будет использовать для обхода капчи. Метод несовершенен, но пользуется популярностью, так как некоторые сложные капчи при помощи него решаются лучше, чем токеном.

Сюда можно отнести такую капчу, как:

  • GeeTest CAPTCHA

  • Click CAPTCHA

  • Draw Around

  • Capy Puzzle CAPTCHA

Существуют капчи, которые можно решать несколькими методами, токенами или координатами. Наиболее надежный способ – решение капчи токеном, но он может быть сложнее, а вот координаты будет легче, но не всегда может сработать.

То ест в случае с координатами, вы получаете не готовый ответ с гарантией, что капча пройдена, а лишь способ ее обхода, а обходить вам все равно придется самостоятельно (вашему боту).

Таким образом, капчу можно решать разными способами и подходами, не последнюю роль тут играют либо технические навыки пользователя или верно выбранный сервис распознавания капчи, а во многих случаях и то и другое.

Распознавание капчи – разбираемся в сложном, для понимания процессе, максимально просто
Показать полностью 7

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Казалось бы, на дворе 2024 год, а пользователи продолжают стойко преодолевать тяготы (читай угадывать где изображены светофоры), которые им выставляет корпорация Гугл в виде капчи и хвастаться у кого больше score, чтобы преодолеть рекапчу посложнее. Тем не менее, по заявлениям некоторых оптимизаторов, капчи уже давно себя изжили и не работают так эффективно, как хотелось бы изначально их разработчикам. Какая же самая наиболее популярная капча современности? Это reCAPTCHA.

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Бесспорно, reCAPTCHA V2, reCAPTCHA V3 и т.п. reCAPTCHA популярнее остальных видов капч. Создана reCAPTCHA была компанией Гугл в далеком 2007 году. Прошло уже много лет с момента появления первой reCAPTCHA, но она продолжает удерживать пальму первенства, периодически немного сдавая позиции конкурентам и отвоевывая их обратно. Но еще ни разу reCAPTCHA не заняла даже 2 место по популярности, несмотря на все ее несовершенство перед нейросетями.

По поводу несовершенства, также есть вопросики. Чего стоит нашумевший доклад компании Open AI (страница 15), в котором они признали, что нейросеть для того, чтобы обойти капчу обратилась к человеку (обманула его, кстати), чтобы это человек помог ей зарегистрироваться на сервисе распознавания капчи 2капча дляобхода капчи. Слишком много капч в одном слове, не кажется? Сути это не меняет — нейросеть не справилась с простейшей задачей, а значит у человечества все еще есть шанс!

Вернемся к статье! Было огромное количество попыток сделать «убийцу рекапчи», какие-то были менее успешными, какие-то только выглядели как угроза reCAPTCHA, а на деле оказывались пшиком, но факт остается фактом, желание конкурентов сделать что-то лучше и надежнее reCAPTCHA демонстрирует ее популярность.

Виды reCAPTCHA

  • reCAPTCHA V1

  • reCAPTCHA V2

  • reCAPTCHA V3

Каждая из них – это улучшенная версия предыдущей reCAPTCHA. Давайте разберемся подробнее почему и чем они отличаются:

Что такое и как распознать reCAPTCHA V1? Очень просто!

Самая первая версия капчи reCAPTCHA V1 представляла собой отрывки текста из отсканированных книг, ее еще называли (и до сих пор называют) простая капча или текстовая капча. Это была достаточно примитивная капча, сильно навязчивая в определенных случаях и раздражающей пользователей.

К слову, сервисы распознавания капчи решают такую reCAPTCHA по самому минимальному тарифу, и формируют маркетинговые предложения, демонстрируя нереально низкие цены на распознавания, также, именно благодаря текстовой reCAPTCHA (правда я ее очень давно уже не встречал, может где-нибудь в даркнете осталась, кто знает)

Юзеру предлагалось ввести текст в специальном окне, сейчас что-то подобное еще можно встретить на старых ресурсах, но на нормальных площадках уже никто не использует reCAPTCHA V1.

ReCAPTCHA V1 была первой версией, представленной в 2007 году. Она использовала искаженный текст из отсканированных книг, который пользователи должны были ввести, чтобы доказать, что они не боты. Эта система использовала ввод пользователей для оцифровки книг, газет и старых радиошоу и конечно же, для обучения своих моделей (не тех, которые на модных показах дефилируют, а тех, которые обучаются при помощи машинного обучения).

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Именно в период, когда Гугл внедрил первую версию reCAPTCHA начали появляться автоматические решатели капчи, которые без особого труда обходили текстовую капчу. Сперва их обучали на массиве и после чего запускали в работу, со временем такие солверы делали все меньше и меньше ошибок и экономили владельцу кучу времени и средств.

С текстовой капчей хорошо справляются всевозможные приложения для распознования капчи, например в Гугл Хроме или в Мозиле.

reCAPTCHA v2 — Как распознать картинки? Где текст?

Все меняется и развивается, и научившись практически бесплатно обходить текстовые капчи автоматизаторы, уже откровенно насмехались над компанией Гугл. То есть, то, что изначально было создано для защиты поменяла свою функцию и уже выступала в качестве внешнего раздражителя для обычных посетителей сайта.

Наконец, после осознания того, что текстовые капчи больше не работают, была создана новая версия reCAPTCHA V2, которая была призвана убрать раздражение юзеров от навязчивости первой версии, повысить безопасность при защите проектов и в целом, улучшить пользовательский опыт.

Вторая версия reCAPTCHA представляет собой пустое поле, при клике по которому появляется галочка, что капча пройдена, либо выскакивает окно со светофорами, которые требовалось найти. Светофоры, это конечно же метафора, вместо светофоров нужно было искать различные предметы. Уверен, вы все понимаете о чем идет речь.

Флажок («Я не робот»): Самый простой вид проверки, где пользователю нужно просто нажать на флажок. Система анализирует поведение пользователя, чтобы определить, человек это или бот. И если у системы не возникают вопросы — вы проходите дальше, а вот если вопросики к вам есть (например ваши куки показались системе слишком подозрительными, так как вы много раз безуспешно выполняли одно и тоже действие на сайте) вас просят потыкать картинки.

Задачи с изображениями: Если система сомневается, она предлагает пользователям выбрать определенные объекты на изображениях (например, «Выберите все изображения с светофорами»). И чем меньше к вам доверия, тем больше будет таких картинок и они будут дольше прогружаться перед тем, как покажутся вам.

Смысл в таком разделении достаточно прост — по задумке Гугл, обычный пользователь интернета, не посещает сомнительных ресурсов, не обращается к одному и тому же ресурсу много раз (как это делают неумные боты) и он просто нажмет на флажок, ну или по быстрому решит пару картинок. А вот бота то, погоняют как следует.

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Что касается противоположного лагеря то с появлением reCAPTCHA V2 старые способы уже не работали, и многие авторешатели прекратили нормально функционировать, рынок начал перестраиваться и продолжает развиваться даже сейчас, так как появляются все новые и новые параметры, которые учитываются при решении reCAPTCHA.

В то время рынок реально просел, большинство парсеров перестало нормально работать, это можно сравнить если не с появлением танков в Первой Мировой войне, то, как минимум с появлением мобильных телефонов. Эта reCAPTCHA полностью поменяла правила игры. И кстати, научно доказанный факт (это не точно), после нескольких бессонных ночей первыми способ обхода второй версии рекапчи выкатила 2captcha, ну а после них уже все остальные подхватили способ и рынок снова ожил.

Несмотря на новизну, вторая версия также сильно раздражала обычных людей и негатив никуда не делся. Система была несовершенна, что побудило компанию Гугл идти вперед и создавать новые продукты. Но не сразу. Какое то время картинки осели на рынке и плотно засели в сознании людей, и пресловутые светофоры уже стали чем-то вроде Xerox в нише копировальных аппаратов (вы ведь знаете эту историю, правда?).

Что такое и как обойти Гугл reCAPTCHA v3? То что невидно распознать нельзя... Или все таки можно?

Решение не раздражать пользователя преследовало компанию Гугл на всех этапах создания reCAPTCHA, но как этого добиться? Путем скрытия reCAPTCHA, так третья версия стала невидимой. Она работает в фоновом режиме, непрерывно отслеживая действия пользователя на сайте и присваивая им оценку риска (от 0.0 до 1.0) на основе их поведения.

Вот тот самый score который я упоминал в самом начале текста. То, чем хитрые боты хвастаются в своих ботокурилках и на совместных ботокорпоративах, а может даже боты мальчики отправляют ботам девочкам в личку score пики, кто знает? В любом случае — этот показатель присваивается каждому пользователю и по различным метрикам вычисляется его значение.

Чем выше score тем быстрее пользователь проходит reCAPTCHA и тем меньше у него проблем. Чем ниже.. Ну, тут думаю понятно.

С появлением новой версии рекапчи революции не случилось, но нервов она тоже подпортила сервисам распознавания капчи. Способ обхода reCAPTCHA V3 был найден, и в для этого лучше всего работают именно сервисы с ручным распознаванием капчи, так как у живого человека score всегда будет лучше!

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Веб-сайты могут устанавливать пороги для оценок риска, определяя уровень взаимодействия или проверки в зависимости от предполагаемого риска. Если владелец хочет максимально улучшить пользовательский опыт, он выставляет менее высокий score и наоборот. Таким образом компания Гугл предоставила владельцам выбор между пользовательским опытом и защитой, найти баланс в этом случае не так и сложно.

Кто эти люди, которые практикуют обход reCAPTCHA и для чего им это нужно?

Зачем в принципе нужно обходить reCAPTCHA? Если ты рядовой пользователь и просто посещаешь веб ресурс, ты можешь решить эту проблему самостоятельно, но другой вопрос, когда тебе необходимо анализировать и тестировать системы своего ресурса на устойчивость к нагрузкам либо для улучшения пользовательского опыта, или для автоматизации рутинных задач.

Капча встречается при парсинге больших объемов данных, например Амазона или какого-нибудь Озона с Вайлдбериз.

Большой объем капчи решить вручную не получится. Для этого разработчики создают всевозможные программы, модули, библиотеки, скрипты и тп для того чтобы обойти reCAPTCHA. Выкладывают свои наработки на githab и другие площадки. Я рассмотрел три основных языка программирования, которые считаются наиболее популярными для автоматизации рутинных задач и собрал топ модулей для распознавания капчи, а также описал как решить reCAPTCHA вручную (без использования готовых модулей).

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Python и reCAPTCHA, как решать reCAPTCHA на python?

Наиболее популярный язык программирования, безусловно Python, код для этого языка программирования ищут в 5 из 10 случаев, когда гуглят «Как обойти рекапчу» в интернете (не учитывая запросов, которые содержат приставку python, типа таких – «как обойти рекапчу на питоне» и тп.

Но если копнуть чуть глубже - почему Питон такой популярный? Вероятно причина в том, что он не сильно сложный с точки зрения изучения и тут очень много джунов и тех, кто еще не дорос до джуна. А если много новичков и не профессионалов - значит много вопросов. И значит распознавания капчи может стать достаточно тривиальной задачей. Именно по этой причине я собрал несколько уже готовых модулей, которые нужно просто подключить в исполняемом файле.

Это не топ модулей, которые являются самым популярными во все времена - это просто пять модулей, которые по различным причинам находятся в поисковой выдаче на топовых позициях. Да, подобных модулей куча, но их нет в топе, а значит их нет в этой статье. Тестирование производительности, сравнение и т.п. не проводилось. Я просто попробовал их на работоспособность и на момент публикации статьи они работали.

Я выделил следующие популярные модули, с помощью которых можно распознать reCAPTCHA (кстати, с помощью всех этих модулей можно распознать и другие типы капч):

Модуль для обхода reCAPTCHA на Python 2captcha

Официальный модуль от сервиса распознавания капчи 2капча, разработан для легкой интеграции с их АПИ, модуль обладает расширенным функционалом и поддерживает настройку прокси. Модуль поддерживается и регулярно обновляется, может быть использован при парсинге веб-ресурсов и автоматизации.

Сервис идеален для пользователей, которые делают упор в распознавании капчи на надежность, а также кому требуется официальная поддержка от сервиса 2капча.

Может это и лишнее, но я уточню, что каждый модуль, представленный в этой статье интегрирует сторонний платный сервис, учитывайте это.

Модуль поддерживает асинхронные операции.

Модуль для распознавания Google reCAPTCHA для Питон

Модуль для решения reCAPTCHA и некоторых других популярных капч (ReCaptcha (v2, v3), FunCaptcha и hCaptcha). Основное отличие его от предыдущего модуля в том, что он более узконаправленный (поддерживает меньшее количество капч) и может менее гибко реагировать на обновления со стороны reCAPTCHA, по сравнению с предыдущим официальным модулем.

2Captcha-solver поддерживает настройку прокси и особенно полезен для задач, требующих высокой производительности, благодаря поддержке асинхронных операций, что позволяет одновременно решать несколько reCAPTCHA.

Модуль написанный под Python — решатель Рекапчи

Многофункциональный модуль, основной упор которого делается на поддержку нескольких сервисов распознавания капчи. Функционал модуля примерно похож на предыдущие два, он поддерживает настройку прокси и асинхронные операции.

Исходя из того, что модуль позволяет интегрировать распознавание капчи через несколько сервисов, то у него есть уникальная функция — перебор сервисов. То есть, вы можете использовать один сервис в качестве остального, а другие в качестве резервных, и когда у вас, к примеру, закончаться средства на основном сервисе, или если основной сервис не справился с задачей, капча уйдет в резервный и будет решена. Таким образом ваш скрипт будет более автоматизированным и не будет зависить от стабильности одного конкретного сервиса.

Модуль для распознавания reCAPTCHA на Python (для Селениума)

Это узконаправленный модуль, который используется для легкой интеграции с Selenium и Playwright, и поддерживает все виды reCAPTCHA.

Модуль можно использовать без необходимости установки дополнительных расширений и для начала потребуется только ключ АПИ.

Его главное отличие от предыдущих модулей — то что twocaptcha-extension-python будет сложно использовать для вопросов автоматизации, где не используется Selenium или Playwright, так как используется исключительно для перечисленных сервисов.

Модуль для распознавания reCAPTCHA V2 и V3 на Питон

Модуль который напоминает по функционалу captchatools, и его можно назвать аналогом указанного сервиса. То есть, вы можете использовать один из них на выбор.

Все характеристики совпадают: поддержка нескольких сервисов, перебор сервисов в процессе распознавания капчи, асинхронные операции, настройка прокси. Все это есть и тут. Различается лишь разработчик.

Ну и предположение от меня, скорее всего оба эти сервиса будут чуть медленнее реагировать на изменения, которые происходят в сервисах распознавания капчи и которые делают разработчики капч, чем официальные модули.

Хочется также отметить, что все перечисленные сервисы (а не только Twocaptcha-extension-python) могут использоваться вместе с Selenium и Playwright, отличие будет лишь в подключении и синхронизации.

Как обойти reCAPTCHA используя Python (пример кода)

Если не доверяете никаким сторонним модулям, я подготовил максимально универсальный код, который можно с небольшими доработками вставить в ваш скрипт, написанный на Питоне и решать reCAPTCHA автоматически. Вероятно под конкретный проект потребуется доработать этот код, но в целом - вариант рабочий и учитывает все параметры указанные в АПИ.

Вот сам код:

Код на Питоне.

Однако, перед тем как использовать предоставленный скрипт, внимательно ознакомьтесь с рекомендациями сервиса, по распознаванию того или иного типа reCAPTCHA, чтобы иметь представление о том, как работает этот код.

Также, не забудьте подставить в коде ваш ключ АПИ и конечно же, установить необходимые модули.

JavaScript и reCAPTCHA, как распознать reCAPTCHA на javascript с помощью модулей

Второй по популярности язык, для которого пользователи ищут способы обхода reCAPTCHA – node js, примерно 3 из 10 запросов по обходу reCAPTCHA приходятся на этот язык программирования.

Тут ситуация точно такая же, как и с предыдущим языком. Не рассматривайте этот список, как список именно лучших в своем классе модулей. Только популярные у поисковых машин инструменты, не более того. Никаких завышенных ожиданий, прошу!

Как и в случае с Python проще всего распознать reCAPTCHA через специальные модули, тем более, что сервисы распознавания капчи заинтересованы в упрощении работы для своих клиентов и многие создают и поддерживают такие модули, вот список наиболее популярных из них.

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Модуль для распознавания reCAPTCHA с использованием Javascript

Официальный модуль для node js от сервиса распознавания капчи 2капча, поддерживает большинство известных типов капчи, в том числе reCAPTCHA. Важное отличие этого модуля от остальных — поддержка TypeScript что делает его удобным для разработки различных приложений.

Все базовые настройки, включая асинхронные операции, настройка прокси и т. п в модуле присутствуют, что делают его универсальным модулем для решения большинства типов капчи. Ну и факт того, что модуль создан сервисом 2капча позволяет сделать вывод о его надежности.

Javascript модуль 2captcha для обхода reCAPTCHA

Также является официальным модулем для распознавания основных видов капчи от сервиса 2капча и поддерживает все те же настройки, что и предыдущий модуль (за исключение поддержки TypeScript), но мне показалось, что он создан больше с упором на простоту интеграции и быстрое начало работы.

Он более легкий, чем предыдущий и он как и его предшественник решает главную задачу — обходит reCAPTCHA. Так что если вам просто необходимо, чтобы ваш скрипт (программа), написанная на node js решала reCAPTCHA, используйте этот модуль, а если нужна более глубокая интеграция, присмотритесь к предыдущему модулю.

Модуль для обхода Рекапчи на Javascript

Модуль заточенный для интеграции с Puppeteer и позволяет решать reCAPTCHA и другие популярные виды капчи.

Помимо того, что этот модуль заточен под Puppeteer, он предоставляет возможность выбора провайдера, решающего капчу, что также позволяет настроить перебор сервисов (как было описано в блоке про модули для Python).

Хочется отметить, что два предыдущих модуля могут быть интегрированы в Puppeteer, но captcha-solver предоставлет решение «из коробки», то есть поставил и забыл, тогда как в случае с 2captcha и 2captcha-javascript может потребоваться ручная обработка результатов или настройка этой обработки.

Javascript модуль чтобы обойти reCAPTCHA

Модуль от сторонних разработчиков, который поддерживает решение reCAPTCHA, а также некоторых других популярных типов капчи. В модуле интегрировано несколько сервисов распознавания капчи, что позволяет настроить перебор сервисов (один сделать главным, а остальные резервными).

Сервис является альтернативой 2captcha и 2captcha-javascript, но возможны задержки в обновлении, так как модуль поддерживается не официальными сервисами, а в остальном функционал у него похож на конкурентов.

Как обойти reCAPTCHA на Node js

Как в случае с Python, для тех, кто не любит уже готовые решения, ниже приведу скрипт для решения капчи с использованием языка программирования node js. Напоминаю, не забудьте установить необходимые модули для работы кода, в том числе:

Пункт Установление модулей для работы кода на Node js 

axios

Установить его можно с помощью такой команды –

команда для установления.

Вот и сам код:

код на Node js

PHP и reCAPTCHA, как распознать reCAPTCHA на php с помощью модулей

И третий по популярности язык, для которого пользователи ищут способ обхода reCAPTCHA — php. Предлагаю начать с модулей, как и в первых двух случаях и закончить кодом. Итак, наиболее популярные модули для решения reCAPTCHA на PHP следующие:

Модуль для обхода reCAPTCHA в Хроме

Этот модуль позволяет легко интегрировать API 2Captcha в ваш PHP-код для решения CAPTCHA. Он поддерживает такие типы CAPTCHA, как ReCaptcha, FunCaptcha, GeeTest, и другие. Модуль предназначен для быстрой настройки и использования, включая поддержку текстовых CAPTCHA и ReCaptcha v3. Он также поддерживает различные методы для работы с изображениями и аудиофайлами.

Как распознать reCAPTCHA используя PHP

Модуль, предоставляющий удобный интерфейс для интеграции с различными CAPTCHA-сервисами, включая 2Captcha. Поддерживает различные типы CAPTCHA, такие как reCAPTCHA и FunCaptcha. Этот модуль ориентирован на легкость использования и быструю настройку.

Фактически, если сравнить два этих модуля, то первый разработан сервисом 2captcha, а второй сообществом разработчиков и оба решают одни и те же задачи и примерно одинаковый набор функционала. Однако, второй модуль может быть менее оперативен в вопросах обновлений, в отличие от официального модуля.

Ну и для тех, кто не привык использовать готовые модули, вот код для интеграции напрямую. Код использует стандартные функции PHP, такие как file_get_contents и json_decode, вот сам код:

Код распознавания reCaptcha на  PHP

Также напоминаю о необходимости заменить некоторые параметры в коде, в частности.

Как распознать reCAPTCHA V2, reCAPTCHA V3 — рабочий метод в 2024 году?

Таким образом, используя приведенные примеры, вы можете закрыть большую часть вопросов, связанных с распознаванием reCAPTCHA. Можете задавать вопросы в комментариях, если они остались!

Показать полностью 7
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества