Появилась идея сделать определенный срез по информации на портале с учетом всего времени его существования... Этот ресурс давно накопил информации не малое количество. Последний гпт уже неплохо умеет в анализ. Что бы на все это сказал ИИ?
Всю карьеру я собираю данные для других. Пишу парсеры, качаю данные, строю пайплайны. Клиенты знают цены конкурентов в реальном времени, отслеживают остатки на складах, мониторят позиции в выдаче. Всё это — для бизнеса.
Для себя — никогда.
А сценарий знакомый: закинул товар в корзину, думаешь — куплю или нет, приглядываюсь. Многие как и я сам, вообще используют корзину как избранное — висит там десяток товаров неделями, пока не созреешь. Заходишь через неделю, а там уже другая цена. Выросла? Упала? Это вообще скидка или просто так написано?
Хотя идея одного инструмента давно крутилась в голове. Человек с профдеформацией парсера не может просто купить ноутбук-телефон-термос. У него чешутся руки.
Идея витала в воздухе, но всё не складывалось — то времени нет, то задача казалась слишком очевидной, чтобы за неё браться. А потом звёзды сошлись, и я сел писать расширение для Chrome. Без стартап-амбиций — просто чтобы видеть историю цены прямо на странице корзины.
Принцип простой: закидываешь товары в корзину и время от времени заходишь на её страницу — плагин сам соберёт актуальные цены и сохранит локально в браузере. Перед заказом мы всё равно туда заходим, ну или можно кликнуть на кнопку плагина — там всё собрано в одном месте.
Такая схема выбрана не случайно. Централизованно собирать цены всех товаров для всех магазинов — это нереально дорого и никогда не окупится. А так — работает на любом магазине, ничего лишнего.
Сейчас поддерживаются все основные: Озон, Вайлдберриз, Яндекс Маркет и другие. А ещё Tasty Coffee — просто потому что сам покупаю там кофе и хочу знать когда выгоднее брать. Если нужен какой-то конкретный магазин — пишите в комменты, добавлю.
Пользуюсь сам. Несколько раз уже видел, как «скидка» на распродаже — это просто цена, которая была две недели назад, а до этого была ниже. Приятно не быть лохом.
Залил в Chrome Web Store, назвал TonyCartoni. Неожиданно дали Featured badge — видимо, не один я так думаю о ценах на маркетплейсах.
Я основатель Hooppy - сервиса автопостинга, через который работает более 5 000 Telegram-каналов. Это даёт доступ к реальной статистике изнутри: частоте публикаций, источникам контента и реакции аудитории в первые часы после выхода постов. На такой выборке хорошо видно, какие инструменты и подходы действительно дают рост, а какие не влияют на динамику, несмотря на популярность.
Ниже - суть из аналитики: конкретные механики и рабочие решения, которые напрямую влияют на рост Telegram-канала.
Что такое парсинг и зачем он нужен
Парсинг - это автоматический сбор постов из чужих каналов по заданным параметрам. Вы подключаете источники: каналы конкурентов, смежные ниши, крупные паблики в Instagram, Telegram, ВКонтакте и других соцсетях. Система мониторит их на фоне и каждый день выдаёт список постов, отсортированных по охвату за последние 24-48 часов. Вы видите только то, что реально зашло аудитории - без ручного скроллинга и догадок.
Это не про «утащить чужой контент» - это про работу с уже подтвержденным спросом. Увидели пост, который резко рванул по цифрам - адаптировали под свою аудиторию и опубликовали (2-3 минуты работы). Именно так растут каналы, которые не придумывают темы с нуля, а используют данные.
Конкретный пример:
Пост IGN в Instagram про отсылки к комиксам в трейлере «Человек-паук: Новый день» резко пошёл в рост - почти 90 000 лайков, сотни комментариев и тысячи репостов. Мой сервис Hooppy сам зафиксировал всплеск, подтянул пост и без моего участия опубликовал его в Telegram-канал.
Пост в Инстаграме
Результат: почти 42 000 просмотров. Спустя 4 дня после публикации поста в моём Telegram - канале.
Результат в Телеграме
Никакой магии - всё сработало автоматически через Hooppy. Сервис сам нашел релевантный пост, сделал рерайт с английского на русский и сразу адаптировал текст под стиль моего канала, после чего обработал и опубликовал его без моего участия.
В этом и есть суть парсинга: использовать то, что уже доказало свою эффективность, и масштабировать результат.
Как я использую парсинг: от чужого контента до готового поста
Всё начинается с настройки источников. Я указываю конкретные страницы, которые хочу мониторить, выбираю соцсеть и метод поиска - по страницам или хештегам. Здесь же сразу выставляю фильтры: какие типы вложений брать, что игнорировать в тексте, как обрабатывать материал перед публикацией.
Настройка источника в Hooppy
После этого открывается лента. Все посты собраны в одном месте, рядом с каждым сразу видна статистика: лайки, комментарии, просмотры. Именно здесь я нашёл тот самый пост IGN - после сортировки по лайкам он сразу оказался наверху и бросился в глаза.
Лента найденных постов
Дальше - открывается редактор. Текст и все медиафайлы уже подгружены. Я выбираю площадки для публикации - в моём случае Telegram и Instagram одновременно - и при желании ставлю отложенное время.
Окно копирования поста
Но публиковать оригинальный англоязычный текст в русскоязычный канал - плохая идея. Здесь в дело вступает встроенный ИИ.
Я просто прогоняю пост через встроенный ИИ прямо в редакторе: он переписывает текст под мой стиль, переводит и делает его живым. На это уходит полминуты - на выходе уже готовый, нормальный текст под мою площадку,
ИИ-редактор с запросом
Кроме перевода и рерайта, ИИ умеет сокращать или расширять текст, добавлять хештеги, смайлы, а также разбивать на абзацы.
Весь процесс - от момента, когда я увидел пост в ленте, до нажатия кнопки «Опубликовать» - занимает меньше трёх минут.
Как выбирать источники для парсинга
Ошибка большинства каналов - без разбора добавлять в мониторинг конкурентов, крупные каналы и случайные популярные аккаунты, а дальше надеяться, что система сама начнет приносить сильные темы. На практике так не работает. Парсинг дает результат только тогда, когда у вас правильно собрана база источников. Иначе в ленте будет либо мусор, либо контент, который уже везде разошелся.
Первое, на что стоит смотреть, - близка ли динамика канала к вашей. Миллионники здесь плохой ориентир: у них другая аудитория, другой уровень доверия и совсем иной масштаб охватов. То, что хорошо заходит у них, у небольшого или среднего канала может не сработать вообще. Поэтому лучше брать источники в 5-15 раз крупнее своего. Если у вас 1 000 подписчиков, ориентируйтесь на каналы с 10-20 тысячами и стабильными просмотрами. Это ближе к вашей реальности.
Вторая важная вещь - фильтр по просмотрам. Без него парсинг быстро превращается в свалку. Вы начинаете видеть всё подряд: проходные посты, случайные публикации, слабые форматы, которые ничего не дали даже у первоисточника. Чтобы искать вирусный контент, нужен не просто поток постов, а отбор по реакции аудитории. Но здесь нельзя ставить один и тот же порог для всех.
Если у вас новостной канал, логика одна: скорость важнее доказанного охвата. В новостях не всегда есть смысл ждать, пока пост наберёт просмотры за 24 или 48 часов. Пока вы дождетесь подтверждения, тема уже устареет. Поэтому для новостных каналов важнее фильтр по свежести: здесь решает скорость, а не охват.
Если канал нишевой - про инвестиции, маркетинг, недвижимость, технологии или бизнес, - важен уже не темп, а подтвержденный интерес к теме.. В таких темах хорошо работают посты, которые за первые сутки собирают уверенный охват. Это показывает, что тема действительно зацепила аудиторию
В случае с авторскими каналами одних цифр по просмотрам уже мало. Далеко не каждый популярный пост можно переносить в свой формат. В авторских каналах важен не только сам инфоповод, но и подача, позиция, тон, конфликт, личность автора. Поэтому здесь нужно смотреть не просто на просмотры, а на то, какие темы вызывают сильный отклик именно как мнение. Иначе можно взять тему, но не понять, за счёт чего она сработала.
Отсюда вытекает ещё одна ошибка - мониторить только прямых конкурентов. Когда все смотрят друг на друга, в ход идут уже пережеванные темы. Сильные темы чаще приходят не напрямую из вашей ниши, а из смежных направлений. Канал про инвестиции часто находит удачные темы не только в инвестиционных пабликах, но и в бизнесе, стартапах, макроэкономике, личных финансах, психологии денег. Канал про маркетинг - в e-commerce, продажах, продукте, медиа и founder-контенте. Канал про медиа или Telegram - в creator economy, YouTube, Instagram, digital-рекламе и платформах монетизации. Смежные ниши часто дают тему раньше, чем она становится мейнстримом именно в вашей категории.
Отдельно стоит сказать про иностранные источники. Англоязычный сегмент часто отрабатывает тему раньше: сначала она вспыхивает в Twitter, Instagram, Reddit, LinkedIn или YouTube Shorts, потом доходит до локальных Telegram-каналов, и только после этого начинается массовое копирование в русскоязычном сегменте. Разница не всегда огромная, но даже 7-14 дней форы уже дают преимущество. За это время можно не просто переписать чужую тему, а первым адаптировать её под свою аудиторию и собрать основной охват до того, как рынок перегреется.
Но здесь важно понимать разницу между “источник популярный” и “источник полезный”. Полезный источник - это не тот, где много подписчиков. Это тот, откуда регулярно проходят посты, которые соответствуют вашим фильтрам и реально дают идеи. Если канал выглядит крупным, но за неделю не дал ни одного годного сигнала, он бесполезен. Если небольшой источник стабильно приносит сильные темы, он ценнее десятка распиаренных пабликов.
Поэтому база источников - это не разовая настройка, а постоянная работа. Каналы выгорают, меняют тему, теряют темп и со временем перестают давать сильный контент. (Их нужно регулярно пересматривать.) Смотрите не на подписчиков, а на последние 10 постов. Если просмотры стабильные и через фильтр регулярно что-то проходит, источник оставляете. Если охваты скачут, контент просел или за две недели не было ничего полезного - удаляете и ищете замену.
Именно здесь многие и просаживают парсинг. Один раз собирают базу и потом месяцами в нее не заходят. В результате мёртвых источников становится всё больше, а сильных сигналов - всё меньше. Рабочий подход простой: раз в месяц проходиться по базе и убирать всё, что больше не даёт результат.
Для большинства каналов рабочая схема такая: собираете 20-40 источников, смешиваете прямую нишу, смежные темы и иностранные аккаунты, ставите нужные фильтры и раз в месяц чистите базу. Тогда парсинг начинает приносить не просто чужие посты, а темы, которые уже пошли в рост или только начинают разгоняться.
Например, если канал про инвестиции следит только за другими инвестиционными каналами, он почти всегда приходит к теме поздно. К этому моменту её уже обсудили и разогнали. Другая картина - когда в источниках есть не только своя ниша, но и бизнес, макроэкономика, финтех, личные финансы и англоязычные аккаунты. Тогда тему можно заметить на раннем этапе, когда она только начинает повторяться в смежных источниках.
В этом и разница: сильный парсинг ищет не просто популярные посты, а ранние сигналы. Выигрывает не тот, у кого больше источников, а тот, кто понимает, какие из них действительно двигают тему вперёд.
Как адаптировать чужой пост, не нарушая авторских прав
Это важный момент, который многие игнорируют.
Копипаст – это нарушение авторских прав и быстрый бан. Адаптация – нормальная практика, которой пользуются все медиа без исключения.
Что значит адаптировать:
Переписать своими словами
Добавить собственный комментарий или кейс
Сменить угол подачи под свою аудиторию
Добавить актуальный контекст
Именно для этого я встроил в свой сервис Hooppy рерайт через ИИ. Нашел пост в ленте парсинга - нажал одну кнопку - ИИ переписал текст за 30 секунд. Я добавляю 2-3 предложения от себя, и пост готов к публикации прямо оттуда же. Итого: 2-3 минуты против 20-30 при работе руками.
Кросспостинг: почему один пост должен выходить везде
Telegram - отличная точка старта. Но если публиковать только там, вы упускаете площадки, которые могут давать такой же или даже больший объём трафика.
Смысл простой: один и тот же пост должен появляться сразу в нескольких местах - ВКонтакте, Instagram, YouTube. Речь не о том, чтобы делать больше контента - а о том, чтобы выжать максимум из уже готового.
Проверяется быстро. Пока пост выходит только в Telegram - охват ограничен одной платформой. Как только он начинает автоматически дублироваться в другие соцсети - общий охват растет, без дополнительной работы.
С видео это еще заметнее. С помощью Hooppy один короткий ролик можно сразу отправлять в Shorts, Reels и клипы, и он начинает жить сразу в нескольких алгоритмах. (Настройка делается один раз.)
5 шагов к росту показателей вашего Telegram канала
1. Найдите каналы конкурентов крупнее вашего. Подключите их в Hooppy как источники для мониторинга. Не изобретайте велосипед - берите то, что уже набрало просмотры у других.
2. Настройте парсинг с порогом просмотров Только посты, которые зашли аудитории. Всё остальное поможет отсечь Hooppy.
3. Кросспостинг на все площадки Один пост - ВК, Telegram, Instagram. Охват в три раза больше.
4. Два поста в день в одно время.
5. Три недели не меняйте ничего. Алгоритму необходим ритм.
Почему Telegram-канал стоит на месте
По опыту анализа каналов: большинство буксует из-за одного - контент каждый раз делают с нуля. Это быстро выматывает, появляются паузы, и канал теряет темп.
У Telegram нет отдельной «оценки качества текста». Алгоритмы смотрят на базовые сигналы:
регулярность публикаций
реакцию аудитории в первые 2–3 часа
Если канал несколько дней молчит, а потом вываливает серию постов - это выглядит как нестабильность. В итоге охваты проседают, даже если контент хороший.
Это одна из функций Hooppy - дальше всё сводится к контролю и масштабу
Помимо этого, в Hooppy доступны расписание публикаций, RSS, геометки для ВК, Instagram и Facebook, а также генерация постов через ИИ. Отдельно отмечу DeepSeek - выбор сделан на основе сравнения. Почему он, а не ChatGPT или Gemini - уже разобрал в прошлой статье. И ещё ряд инструментов, о которых не стал расписывать. Это уже не про базовые функции, а про системный рост. Такие вещи становятся понятны только в работе.
Сюда приходят не за «попробовать». Подключаются те, кому нужны точные данные, скорость и инструменты без ограничений - владельцы каналов и проектов, которые считают метрики и выстраивают рост. И таких пользователей с каждым месяцем становится больше.
Если вы здесь - значит, вы не просто смотрите, а ищете решение. Можете посмотреть это в работе на hooppy.ru - базовая настройка занимает около 15 минут.
Бизнес обяжут по первому требованию (если это предусмотрено законом) переключать клиента на живого оператора.
Первая за долгое время хорошая инициатива. Надеюсь ушлепки из всяких Яндексов и Сберов не прогнут законодателей, это нужно принимать, причем как можно быстрее.
У нас бизнес, к сожалению, не умеет в саморегуляцию и ответственность. У них только отчёты в глазах, сколько сэкономили на "внедрении ии". Я тут месяц назад в поддержку Сбера писал, это просто издевательство. Еле пробился через бесполезного бота. В голове не укладывается, как поддержка крупного БАНКА может так работать? Ее по сути нет. Не можете работать нормально - пускай государство даст вам пинка, ушлепки.
Вышел законопроект об ИИ, вступление которого намечено на сентябрь 2027 г. Но если прочитать текст целиком, становится ясно, что этот закон легализует кражу контента для одних и ломает фундаментальные алгоритмы продаж для других. Фактически, это первая попытка переписать правила игры и заключить новый общественный договор в цифровой среде.
Закон впервые лезет практически во все серые зоны, в которых мы привыкли работать:
Маркировка контента перестает быть доброй волей. Платформы обяжут внедрять автоматические детекторы (ст. 12 ч. 4), а обычным пользователям будет грозить ответственность за затирание "водяных знаков" (ст. 12 ч. 7). Если алгоритм пропустит дипфейк без плашки — отвечать будут все по цепочке.
Разработчикам ИИ теперь легально разрешили пылесосить чужой контент для обучения моделей без согласия авторов (ст. 13 ч. 5). Авторов просто лишили права на защиту ради прогресса ИИ, хотя, справедливости ради, до этого парсили и так без спроса.
Вводится запрет на использование ИИ для эксплуатации уязвимостей человека и воздействия на поведение (ст. 3 п. 14, ст. 10 ч. 2). Если норму не пересоберут только под LLM, то под удар попадают все фундаментальные рекомендательные алгоритмы Яндекса, Сбера и ВК, эксплуатирующие срочность в такси или эмоции в рекламе.
Гражданам дают право на отказ от ИИ (ст. 9 ч. 3). Бизнес обяжут по первому требованию (если это предусмотрено законом) переключать клиента на живого оператора. С одной стороны это понизит произвол, но с другой — открывает портал для потребительского экстремизма, так как регламента проверки человечности нет, и пользователи будут массово парализовать работу поддержек. Кто будет контролировать, что это реальный человек, а не ИИ с другим промптом, и как это реализуют — непонятно.
Вводится право на прозрачность: вы будете знать, когда решение по вам принял алгоритм (ст. 9 ч. 2). И здесь же заложена бомба — право на досудебное обжалование (ст. 9 ч. 4). Это значит, что госорганам и компаниям с госучастием придется как-то объяснять логику «черного ящика», что технически почти невозможно.
Уморительным показалось введение требований к ИИ по учету духовно-нравственных ценностей (ст. 4 п. 6). Кто и как будет это отслеживать? Есть риск, что это превратится в цензуру как в условном DeepSeek, когда ничего плохого нельзя генерировать про Китай.
Важно понимать, что сейчас это только проект. До сентября 2027 года его будут не раз переписывать под настроения общества и бизнеса и под давлением лоббистов. Например, то же ограничение запрета на манипуляции, чтобы оно распространялось не на весь ИИ, а только на LLM. К тому же есть риски, что бюрократия и крупные игроки просто не позволят предоставляемыми государством льготами (доступ к электричеству и суперкомпьютерам) пользоваться другим, менее крупным игрокам.
Это сложный баланс, а не игра в одни ворота. Государство дает бизнесу право пылесосить чужой контент и льготы. Бизнес взамен берет на себя тотальный контроль и ответственность за безопасность. Люди же получают защиту от манипуляций ценой окончательной потери приватности своего контента. Вопрос лишь в том, не окажется ли этот договор кабальным для обычного пользователя.
Здравствуйте, добрые люди помогите, нужно спарсить ЦЕНУ предмета с сайта в Гугл Таблицу, чтобы она обновлялась автоматически, весь вечер пытаюсь, голова кипит, не получается.
Вы когда-нибудь сталкивались с проблемой, когда вам срочно нужно куда-то лететь, но на выбранное направление и дату просто нет билетов?
Вы верите, что один билет, скорее всего, появится — кто-то отменит свой рейс или авиакомпания добавит ещё один самолёт. В такой ситуации вы начинаете постоянно проверять сайт «Аэрофлота» в надежде, что успеете поймать этот билет.
Когда я понял, что не могу быть у компа все свободное время, я сделал расширение для браузера Chrome, которое проверяло билеты за меня каждые 5 минут, а найденный билет присылает на почту.
Вот так выглядит интерфейс
Для работы нужно запустить поиск на сайте Аэрофлота, указать дату, направление и количество пассажиров, затем скопировать финальную ссылку ссылку и вставить ее в расширение. А дальше просто не выключать компьютер.
Очень много усилий было потрачено на то как связать Телеграм и расширение, в итоге удалось выкрутиться через такую же систему, как в Теремке: в телелеграме создается код, который служит логином в приложении.
Кто-нибудь знает, Аэрофлот может заблокировать таких пользователей? Не смотря на довольно редкие интервалы запросов - раз в 5 минут?
Постараюсь опубликовать это расширение в магазин приложений браузера Chrome, если кто-то уже публиковал, расскажите сложно ли?