В узкой нише проблема обычно не в том, как найти блогеров. Проблема в том, что из десятков тысяч профилей нужно быстро выкинуть шум и не потерять тех, кто реально даст результат. Здесь и помогает ИИ: помогает отделять реальные тематические аккаунты от случайных профилей по описанию и контенту.
Когда ниша узкая, обычно думают так: сейчас найдем пару десятков блогеров по ключевым словам, руками посмотрим профили и быстро соберем нормальный список.
На практике почти никогда не ломается сам поиск. Ломается этап после него.
Аккаунтов и каналов находится слишком много. В выборке оказываются соседние темы, фан-страницы, магазины, архивные профили, мемные паблики и просто шум. Дальше команда несколько дней смотрит ссылки вручную, спорит, кого оставлять, а в конце все равно не уверена, что получила рабочий список.
Мы разбирали это на кейсе из ниши CS2. Не пытались сразу вытащить "идеальных" авторов. Сначала собрали максимально широкий слой по трем платформам, а потом уже резали его фильтрами и классифицировали с помощь иишки на нашей же платформе.
Если хотите не только читать кейс, но и посмотреть примеры результата, то их можно получить тут!
Почему ручной поиск почти всегда буксует
Если делать все руками, почти всегда появляются три проблемы.
Первая: слишком много мусора. Формально аккаунт может быть рядом с темой, но для закупки бесполезен.
Вторая: слишком рано режут по подписчикам. Это удобно, но именно так из списка первыми вылетают микроавторы с живой и точной аудиторией.
Третья: даже когда ссылок уже сотни, все еще непонятно, с кем можно идти в переговоры, а кого лучше оставить просто в общей базе.
В итоге база вроде есть, а рабочего списка для закупки все еще нет.
Что сделали вместо этого
Сначала собрали широкий массив, а не "короткий красивый список".
- 1 227 аккаунтов в Instagram*
- 46 298 аккаунтов в TikTok
- 4 255 каналов в YouTube
Параллельно подтянули и контент:
- 24 786 reels в Instagram*
- 63 681 ролик в TikTok
- 240 602 видео в YouTube
В сумме это дало 51 780 профилей и каналов и 329 069 единиц контента.
Звучит как перебор, но именно на таком объеме становится видно рынок, а не случайные находки из пары запросов.
Потом подключили ИИ-классификатор и убрали все, что не относится к теме
После первичного сбора никто не отдавал клиенту весь массив как есть.
И здесь важен момент: мы не пытались решить задачу тупым фильтром по одному слову вроде cs2 в нике. Мы использовали ИИ-классификатор. Он смотрел сразу на три вещи:
- ник;
- имя профиля;
- описание аккаунта.
Но и этим не ограничивались.
Если по самому профилю было недостаточно понятно, но аккаунт проходил по цифрам, в первую очередь по подписчикам и свежим просмотрам за N дней, мы не выкидывали его автоматически.
В таком случае мы подтягивали свежий контент автора, смотрели описания роликов и уже по содержанию понимали, это реально профиль по теме или просто похожее название.
Перед запуском мы показали ему, кого считать целевым, а кого нет.
В целевые примеры попадали:
- официальные аккаунты по Counter-Strike;
- игровые платформы вроде FACEIT;
- профили с клипами, гайдами и обучением по CS2;
- личные авторы, у которых тема CS2 прямо заявлена в описании.
В нецелевые примеры попадали:
- аккаунты, где также другие игры обозреваются;
- магазины техники и аксессуаров;
- музыкальные и юмористические страницы;
- случаи, где слово выглядит знакомо, но по смыслу вообще про другое. Например, `ESL` может означать не киберспорт, а обучение английскому.
То есть ИИ учился не ловить ключевое слово, а понимать смысл аккаунта и его контента.
Например, аккаунт с описанием про `CS2 tips`, киберспорт или `Counter-Strike` он относил к теме. А профиль вроде `cs2_music_factory` или страницу, где в описании написано про музыку, магазин или мотивационный контент, он не тащил в целевую выборку только из-за совпадения в названии.
А если профиль был спорный, но у автора были нормальные цифры, в ход уже шли свежие описания роликов и сам контент (транскрипт и визуал).
Это важно, потому что часть нужных аккаунтов плохо объясняет тему в шапке профиля, но очень ясно показывает ее в публикациях.
Дальше решение не сводилось к простому "да или нет".
Если профиль был явно в теме, он получал целевой статус. Если явно мимо, уходил в отказ.
За счет этого команда не тратила часы на ручной просмотр всего подряд, а разбирала только то, что действительно требовало внимания.
После этого фильтра из `51 780` профилей и каналов осталось `3 436` релевантных кандидатов:
- 455 в Instagram*
- 1 665 в TikTok
- 1 316 в YouTube
То есть больше 93% исходного объема даже не дошло до рабочего слоя. И это, по сути, главный выигрыш по времени: команда перестает вручную смотреть то, что вообще не должно было попасть в короткий список.
Дальше собрали отдельный приоритетный слой по свежей активности
Следующий шаг был уже не про общий рынок, а про приоритет.
Мы отдельно собрали слой аккаунтов и каналов, которые:
- уже прошли тематический матчинг;
- показывали свежую активность;
- подходили для быстрого перехода к следующему этапу работы.
В подтвержденном приоритетном слое сейчас находится:
- 455 аккаунтов в Instagram
- 719 аккаунтов в TikTok
- 202 канала в YouTube
Итого 1376 кандидатов в приоритетном слое.
Здесь важно не перепутать термины: это не "весь рынок" и не "все релевантные аккаунты". Это уже следующий слой, куда попадают только те, кого имеет смысл разбирать в первую очередь.
Что клиент получил на выходе
Не "таблицу на посмотреть" и не набор случайных ссылок.
На выходе получилось три рабочих слоя.
Первый - полный массив по нише: 51 774 профиля и канала и 329 069 единиц контента.
Второй - релевантный тематический слой: 3 435 кандидатов, которые реально относятся к теме.
Третий - приоритетный слой: 1 376 кандидатов, которые уже подходят для более быстрого перехода к разбору и переговорам.
То есть вместо хаоса из ссылок клиент получает понятную структуру:
- вот широкий рынок;
- вот кто реально по теме;
- вот кого стоит разбирать в первую очередь.
Почему кейс полезен не только для CS2
Та же проблема возникает в любой теме, где нужно искать авторов, партнеров или площадки: рынок большой, сигнал слабый, а команда очень быстро начинает путать "много найденного" с "много полезного".
Обычно деньги и время теряются не на том, что блогеров мало. Они теряются на ручной чистке, повторной проверке и слишком грубых правилах отбора.
Именно поэтому здесь важен не сам факт большого сбора, а порядок действий:
1. сначала собрать широкий слой
2. потом отрезать нерелевантное
3. потом смотреть на свежую активность
4. и только после этого принимать решение, кто реально годится для работы
Если пропустить середину и резать сразу по подписчикам, список получается удобный, но слабый.
Если вообще не резать, получается большая свалка, с которой снова придется работать вручную.
Короткий вывод такой: в узкой нише проблема обычно не в том, как найти блогеров. Проблема в том, как быстро убрать шум и не выкинуть по дороге тех, кто потом даст лучший результат.
Там покажу примеры выгрузки, отсева и рабочего списка.
Нужен такой же результат, но уже под вашу нишу и ваши критерии, напишите мне в личку.
Разберем задачу и посмотрим, какой массив и какой короткий список можно собрать именно для вас.
*Instagram принадлежит компании Meta Platforms Inc., которая признана экстремистской организацией и запрещена на территории Российской Федерации.