Мне очень нравится контекстная реклама. Ищешь ты например декоративные 3d панели на стену. И после поиска в Пикабу или Вконтакте тебе начинают показывать магазины с этими декоративными 3d панелями - вот тебе дорогой пользователь панели под скалу, дерево, вот такие, вот сякие.
Половина магазинов это помойки, которые не дают посмотреть каталог продукции, цены, весь сайт которых утыкан формами обратной связи, которые надо заполнить чтобы тебе перезвонили. Трижды-блядская-ярость, терпеть такие не могу. Но есть и нормальные. Где можно скачать прайс себе на почту а оператор деликатно напишет в мессенджере через какое то время и не будет блять звонить тебе. Или где просто есть каталог продукции, а ты можешь позвонить (а гораздо лучше написать в мессенджере) когда хочешь.
Это я к чему. Терпеть не могу когда вторгаются в мое личное пространство ради всякой ерунды и навязывают общение. Единственный допустимый формат рекламы в 21 веке это контекстная в социальных сетях. Но не раздражающие всплывающие окна, а аккуратные ненавязчивые рекламные окошки слева или справа на сайте, не мешающие просмотру содержимого. Холодный обзвон в любом виде надо запретить на законодательном уровне, потому что достали. В принципе его не должно быть, ни при помощи роботов, ни при помощи людей. Максимум сообщение в мессенджере или на почту, которое можно удалить и которое должно быть контекстным. Остальное это вторжение в личное пространство.
Тут долбоебы-маркетологи додумались до новой фичи. Звонит значит тебе номер неизвестный, берешь трубку, а там робот тебе говорит "Не кладите трубку, оператор ответит менее чем через минуту".
Короче.
Вы хоть суки деньги даром раздавайте. Ничего кроме ярости вы не вызываете. Чтоб вас каждую ночь полтергейст ледяной насиловал!
Как поисковые системы определяют спам и попадает ли под это генеративная литература?
Что такое спам в современном поиске?
Спам в поисковых системах эволюционировал от примитивного разбавления текста ключевыми фразами до сложных схем с искусственной генерацией контента и сетевыми структурами сайтов. Две главные угрозы последнего десятилетия:
Синонимайзинг. Автоматическая перезапись текстов с заменой слов на синонимы без понимания смысла, создающая более менее «читабельный мусор». Иногда не читабельный…
Сайты-прокладки или в народе дорвеи. Страницы-ловушки, оптимизированные под вкусные запросы с поисковиков, но перенаправляющие пользователей на коммерческие или рекламные ресурсы. Серое и чёрное SEO.
Эра ручных правил в 2015–2018 годах.
Google Panda. Борьба с «тонким контентом», но легко обходится через синонимайзеры типа «перефразировать текст онлайн». Сайты-прокладки маскировались под редиректы через мета-теги.
Яндекс АГС-40. Фильтр бил по «трафиковым» сайтам с неестественной морфологией. Для русского языка ключевым было выявление неестественных падежных конструкций «купить квартиру Москва» вместо «купить квартиру в Москве».
Нейросетевой прорыв 2019–2022 годов.
Google BERT от 2019 года научился анализировать контекстную связность предложений. Синонимайзерные тексты распознавались по нарушению логических связей через «кофе вкусный следует, что кофе аппетитный» и аномальной плотности синонимов в одном абзаце. Ключевой момент! Главное, не перебарщивать!
Яндекс Королев от 2020 года. Система выявляла сетевой спам через анализ IP, хостингов и ссылочных графов. Например, кластер из 50 сайтов о «ремонте холодильников», ведущих на один магазин, вычислялся за 2-3 часа.
Эра генеративного ИИ в 2023–2025 годах.
SpamBrain 4.0 от Google. Мультимодальная нейросеть, которая сравнивает семантические векторы оригинального и переписанного текста, обнаруживает «галлюцинации» AI и фактические ошибки в сгенерированном контенте, а также анализирует паттерны поведения пользователей через время на странице, коэффициент кликабельности и отказы, которые для дорвеев составляют более 95% за период менее чем 5 сек. Это ключевой критерий спама уже давно и решают это не алгоритмы, а пользователи, которые безошибочно видят спам.
YandexGPT-детектор. Для русского языка критично важна морфология и сочетаемость слов. Примеры нарушений — «Срочно чиним холодильники» и «Срочно чиним холодильные шкафы». Это неестественное сочетание! Или, «Купить диван» значит «Приобрести лежанку» — это смена семантики.
Культурные особенности русского и английского языков и морфологическая сложность.
В русском спам-текстах чаще встречаются ошибки в падежах и «ремонт стиральных машинок» вместо «стиральных машин» — это ключевой маркер для Яндекса.
Английский контент проверяется на естественность артиклей «a car» vs «the car» через BERT-контекст.
Семантические поля.
В Google акцент на топическую связность. Например, для запроса «микроволновка» ожидаются слова «тарелка», «подогрев», а не «электромагнитное излучение» в 90% текста.
Яндекс строже к локальному контексту, так для Москвы «ремонт окон» это «установка стеклопакетов», а для Ростова — «замена оконных рам». Интересно, сам об этом никогда бы не подумал…
Примеры из практики
Кластер сети «ремонтных» дорвеев в 2023 году:
412 сайтов с текстами, сгенерированными через синонимайзер на базе ChatGPT. Вычислены Google через:
Анализ редиректов JavaScript идёт через 302 редирект и на коммерческий сайт.
Совпадение семантических векторов с эталоном «спам-шаблона».
Фильтр «Баян» от Яндекса в 2024 году:
Заблокирован сателлитный кластер из 17 сайтов с контентом, переписанным через «перефразировать текст онлайн». Маркеры спама:
78% биграмм совпадают с исходником при норме менее 40%
Одинаковая структура H2-H4 на всех страницах.
Будущее борьбы и тренды 2025 года.
Проактивные системы от Google’s SpamBrain теперь генерирует спам-контент сам, чтобы тренировать детекторы.
Кросс-платформенный анализ и учёт данных из соцсетей, мессенджеров. Рассылки в Telegram маркируются как спам при более чем 60 сообщений в сутки.
Этическая экспертиза через запросы вроде «как сделать рассылку спама» попадают под фильтрацию, а их авторы — в группу риска. Жёстка! Теперь опасно спрашивать что-либо у поисковиков…
Выводы
Главный сдвиг десятилетия — это переход от поиска ключей к оценке смысловой целостности. Если в 2015 году спамер выигрывал за счёт объёма, то в 2025-м даже YandexGPT-сгенерированный текст распознается по аномалиям в сочетаемости слов. Технологии типа SpamBrain 4.0 или «Королев» делают массовый спам экономически невыгодным и стоимость обхода фильтров на 70% выше потенциального дохода по данным за 2024 год. Как сказано в Google Search Central: «Сайты, нарушающие политику, могут не появляться в результатах вовсе», — и это уже не угроза, а реальность.
В серии постов я рассказала про путь борьбы со СПАМом от Почта Банка. Пора подвести черту.
Дело о взыскании морального вреда рассматривалось без участия представителя банка. Письменно они, конечно же, возражали. Однако, суд согласился с доводами истца о том, что за год банковского произвола я достаточно натерпелась.
Решение суда
Иск о возмещении морального вреда удовлетворён в полном объёме, в том числе ответчику надлежит возместить мне расходы на госпошлину за подачу иска и почтовые расходы (подавала отдельным заявлением).
Решение суда Банком не обжаловалось и вступило в законную силу. Исполнительный лист направлен судом на исполнение в адрес московских судебных приставов.
Сейчас в ФАС находится ещё пара моих жалоб на незаконную рекламу. Расскажу о результатах после рассмотрения.
Также добавлю, что нарушители замечательно уходят от ответственности, заключая договор о привлечении клиентов, а потом говорят: «Ничего не знаем, это не мы СПАМим, мы своих исполнителей не просили направлять рекламу на этот номер». И никакого спроса с них нет. В такой ситуации выйти на непосредственно на рекламораспространителя труднее. Возникают сложности с привлечением к административной ответственности, если ФАС не удаётся надлежащим образом известить привлекаемое лицо о рассмотрении жалобы. В то же время при рассмотрении дела в суде сообщение считается доставленным, если адресат уклонился от получения корреспонденции в отделении связи, и письмо было возвращено по истечении срока хранения. Жаль, что в ФАС это не работает.
Направьте заявление о отзыве согласия на обработку ПДн Компании1 и Компании2 (оригинал, заказное с уведомлением). Вы не обязаны делать отзыв во все компании которые указаны в списках, тк вы им не давали им такое согласие, а вы дали прав Оператору предать свои ПДн им. Когда вы направите отзыв, оператор обязан их удалить и прекратить обработку и соответственно предоставлении другим лицам. Для уверенности, в сопроводе к заявлению на отзыв лучше уточните что прошу прекратить предоставление, и получить ответ что ваши данные отозваны. А если от этих компаний продолжат поступать реклама и тд, сразу заявления в РНК и Банк России о том что ваши ПДн обрабатываю без согласия. Их там быстро на землю опустят. Если начнут еще и разбираться, и глубоко копать, то возможно еще и банкисру подлетят, тк они взяли на себя обязательства как Оператор ПДн.
Я делаю проще-когда мне предлагают карту, кредит, т.д. я на все соглашаюсь и вызываю курьера к себе домой. Ну как домой-на другой конец города, в старый сектор, где грунтовая дорога и ямы. Или в человейник на другом конце города, где натурально очередь на дороге, чтобы туда въехать или выехать. Пару раз так курьер скатается-никто никогда больше не звонит. Даже АльфаБанк. Даже тинек!
Мы с женой решили зарегаться проверить кредитную историю (да можно было и проще), в итоге на следующий день получили десятки звонков от разных банков :D
И самое печальное что в ТП говорят теперь вы САМИ должны написать в СОТНИ организаций чтобы удалить свои персданные у них)
P.S. Конечно я сам себе буратино, но вдруг кому поможет не наткнуться на эту же проблему)