Парсинг: истории из жизни, советы, новости, юмор и картинки — Все посты

Сетевые конторы в Телеграм (сантехника)⁠⁠

8 дней назад

ДЛЛ: если вы обратились в чат ЖК с просьбой порекомендовать какого-нибудь специалиста, обязательно проверьте, состоит ли порекомендовавший его сосед в вашем чате.

Надысь в очередной раз полилась вода из кухонной вытяжки (СПб). На плиту и духовку под ним. Это у нас раз в полгода повторяется - стыки вентшахты и плит перекрытия ни у кого не заделаны (дом 2021 постройки) и когда у кого-то в узле водоподготовки начнет течь, поток устремляется в шахту, а потом через спутник к нам.

Необычные звуки привлекли внимание, и оказалось, что это не кот блюет.

Звонок соседке сверху (уже топила год назад, фильтр рванул) выявил ее отсутствие в квартире, время прибытия - 40 мин. Позвонил в УК с докладом.

Визит УК в составе сантехника и дежурной выявил протечку в квартире над нами через этаж - потек стык счетчика и магистрали ГВС (ПВХ). Монтаж был год назад и вот, при отключении горячей воды стрельнуло.

Как самый страдающий от инцидента (льет на столешницу, варочную панель и духовку), решил добраться до виновницы и поинтересоваться перспективами решения проблемы.

Чуйка не повела - решение проблемы застопорилось. УКшный сантехник перекрыл кран ГВС в квартире и произнеся сакраментальное - ~~ебитесь как~~ ищите сантехника в открытых источниках, свалил в закат. Свое нежелание исправлять аварию мотивировал чрезвычайной загруженностью по решению общедомовых задач (частично присутствуют).

Как итог я остался один на один с охуевшей от обстоятельств хозяйкой и ее немым вопросом - а что дальше делать?
Меня, по правде говоря, волновал одно - через скока времени она не дай бог по какой-либо нужде снова откроет перекрытый кран и я опять пойму, что это не кот...

С другой стороны, было очевидно, что если хозяйка щас в Яндексе начнет искать сантехника, то ее не только разгрузят косарей на 20-30, но еще с высокой вероятностью нихуя не сделают.
А как вообще быть, если по итогу после проеба двух месячных пенсий ее накроет и под стрессом она перестанет открывать дверь, оставит открытым кран - это целый квест. Еще по разговорам с УК я понял, что перекрытие стояка парадной - проблема неординарная и пару часов мне придется скакать с кастрюлями. А вода из вытяжки в кастрюли падает с высоты, летят брызги и водичка просачивается в стыки варочной и столешницы. А она (столешница), пытается разбухать. В общем, я пообещал хозяйке попробовать найти проверенного сантехника через чаты ЖК, в которых состою, и передать ей.
Собственно, это была завязка.

Развитие.
В ТГ час нашего ЖК (1 121 ~~рыл~~ соседей) кидаю просьбу порекомендовать проверенного сантехника.

Через 5 минут прилетает первый добрый совет.

Благодарю и звоню по номеру...
Отвечает мужик, спрашивает суть проблемы (поверхностно), адрес, говорит, что завтра может помочь. Я начинаю объяснять, что заказчик не я и нужно связаться с клиентом... И звонок сбрасывается...
Пытаюсь перезвонить - не дозваниваюсь...

И чем бог миловал - через 3 минуты на мой номер начинаются звонки с 3 московских номеров с периодичностью в 2 минуты. Звонящий - "мы вот тут с вами общались, звонок прервался, я перезваниваю..."
Только вот голоса звонящих похожие, но разные и по наводящим вопросам им они не в курсе контекста первого разговора, который прервался.

Все кроме замазанных (затопившая соседка) - МСК

Хуясе, думаю. Ищу в поиске по чату соседку с переданным мне контактом сантехника и не нахожу - в домовом чате, где я писал просьбу поделиться им, ее нет. Блочу эту соседку в ТГ, через 3 минуты шквал звонков из Москвы прекращается.

Тут небольшой оффтоп про психологию - мне очень хотелось проверенного сантехника назавтра чтобы решить проблему. И когда прилетело второе сообщение от соседки с номером сантехника, я туда позвонил.

Там диспозиция была другая. Человек сразу спросил, у кого течь. Я объяснил, что у соседки сверху. Он попросил ее телефон (логично). Я дал.
Сижу, и думаю... бля... Ищу вторую "соведку" в чате ЖК - хуй!
Звоню затопившей меня мадам, объясняю ей весь расклад. Ей второй мастер уже позвонил, договорились на завтра на утро чинить. Но топившая меня мадам оказалась сообразительной - "Вы знаете, Алексей, меня смутило что номер, с которого этот сантехник звонил, отображается как Московский."
Кароче, мы с ней договорились, что она звонит туда и отменяет заказ. На случай, если начнут наезжать, говорит, сто пришел сантехник из УК и все починил. Отменила, наутро никто к ней не приехал (отдельно предупредил, что если заказанный и отмененный специалист с утра начнет к ней ломиться, слать его нахер и в квартиру не пускать).
Вот такой пердомонокль в социальной инженерии, дорогие Пикабушники.

ПС1. Где искать сантехника? Пошел в УК, долго ругался, мотивируя тем, что не устраняя проблему в индивидуальном узле, они создают длящеюся аварию, приносящую ущерб имуществу собственным жильцам. В результате УКшный сантехник согласился исправить проблему, что на следующий день и выполнил.

ПС2. Как такое возможно?
На это есть несколько версий:
1. Сетевые конторы парсят чаты ЖК с большим числом участников. Таких ЖК в 16 городах-миллионниках, по всей видимости, больше 10 000. Но чтобы их парсить, вы должны туда вступить. Это не всегда просто, т. к. иногда для этого требуется не только обойти бота с капчей, но и пройти ручную модерацию. Но тем не менее такой вариант вполне рабочий.
2. С п. 1 есть такая проблема - в собственном чате я месяц назад прокинул тему про ВПН (просто была фраза "MTPProxy") и через 5 минут нам прилетела реклама его от вновь вступившего пользователя.
Ту без вариантов про парсинг - в канале 70 ~~делб (включая модераторов Пикабу)~~ (извинити) пользователей и он ни при каких обстоятельствах не мог попасть в списки для парсинга.
И это точно не популярные боты-помощники типа ChatKeeperBot - у нас он не установлен.
3. Поэтому есть высокая доля вероятности, что ключевые слова в частных чатах ТГ продаются. Кем (самим ли ТГ или канторами на аутсорсе за комиссию, не важно). Главное - будьте бдительны!
Если вы обратившись в чат к своим казалось бы реальным соседям (которые вряд ли вас обманут), будьте готовы их проверить хотя бы на регистрацию в чате, куда вы обратились.

ПС3. Наутро (через 12 часов после обращения в домой чат) прилетел 3-й контакт сантехника от доброй соседки. Тоже не в домовом чате, перезванивать по номеру не стал.

КМК, присутствуют несколько моделей наебки:
1. TG, по всей видимости, сливает ключевые слова из чатов (см. ПС2). Но услуга дорогая, не все, похоже, могут ее себе позволить.
2. Парсинг - 3-й лже-контакт от "соседки" через 12 часов после просьбы очень похож на обычный парсинг без привлечения TG.

Как вывод - будьте, пожалуйста, бдительны. Особенно если вы вызываете специалиста не себе, а маме, соседке или забухавшему другу. Проверьте (позвоните сами как будто это вы и есть заказчик) не только его регистрацию в чате, где он вам написал, но и попытайтесь пообщаться - как правило бот заглючит и начнет нести противоречивые тезисы при обсуждении предметных и сложных обстоятельств вашей проблемы.

ПС4. @Chatlanka просила меня не доебываться до Пикабушников попусту, но тут я попрошу нашего уважаемого @nestandart2886 прокомментировать, сталкивался ли он с похожими ситуациями и что он по этому поводу думает.

Резюме.
1. В общедомовые чаты все-таки стоит обращаться за помощью, если у вас срочная проблема. Это, скорее всего, более эффективный путь, чем обращаться в конторы, выдаваемые в первых списках Яндекса или других поисковиков. Принцип простой - первые места в выдаче поисковиков очень дорогая услуга, которая вряд ли окупается оказанием качественной работы за вменяемую цену. Скорее всего - это сетевые конторы, которые начнут вас разводить на сумасшедшие деньги, причем не факт, устранив реальную проблему.

2. После получения в чате контакта специалиста:
2.1. Проверьте, состоит ли рекомендатель в чате вашего ЖК
2.2. Если состоит, насколько активен он был в общении (если он не общался в чате - не публиковал сообщения), есть повод задуматься.
2.3. Если вы все же решили позвонить этому мастеру, попробуйте подгрузить его лишними обстоятельствами, усложняющими ему ответы по "скрипту". Типа: я еще не до конца определился, нужна ли мне ваша услуга (жду ответа от сантехника от УК). Но позвонил, чтобы узнать ваши условия... При такой формулировке у "специалиста" может поплыть скрипт и он может начать произносить вещи, не соответствующие логике вашего запроса на услугу. Например: "Ну и что, что сантехник от УК еще не решился, я приеду - просто посмотрю, бесплатно." Это 100% спам о обман, не ведитесь на это.
Если вы вдруг ляпнули, что согласны на услугу, а потом до вас дошло, что что-то не так, не стесняйтесь перезвонить на номер, по которому вы общались и отменить заказ.
Если дозвониться не удалось, ни в коем случае не пускайте "мастера" в квартиру когда он по вашей заявке придет. Через закрытую дверь объясните, что заказ вы отменили и в услугах не нуждаетесь. При слишком назойливой попытке проникнуть к вам, предупредите, что вы вызовете полицию по поводу незаконного проникновение в ваше жилище. Если прессинг вас не прекратится, вызывайте полицию - неизвестный вам человек штурмует вашу дверь и требует ее открыть.

3. Если от соседей ничего кроме спама не пришло, идите в УК. В каждой УК (ТСЖ) должен быть дежурный сантехник (время прибытия на аварию - 2 часа). Формально, УК не обязана устранять повреждения за пределами ее зоны ответственности (как правило после счетчика). Однако вы можете настаивать на том, что вам достоверно не известно, находится ли дефект в зоне ответственности вашей или общедомового имущества. И при прибытии специалиста при известной силе убеждения (и аргументации, что его невмешательство произведет значительный ущерб другим собственникам), а также факта того, что внутриквартирную вашу проблему он будет устранять на коммерческой основе, скорее всего, попробуйте убедить его оказать необходимую вам услугу.

4. Надеюсь, участники Сообщества накинут еще достаточно здравых советов как решать указанную проблему.

Все всех благ.

Пропущенный пост скоро появится - уронил систему, почти восстановил.

Показать полностью 5

ParsingSite

Бизнес

Прайсы редко ломаются так, чтобы это сразу было видно⁠⁠

1 месяц назад

Устаревшие цены конкурентов иногда опаснее, чем отсутствие данных.

Обычно всё выглядит спокойно:

файл открылся;

строки на месте;

цены есть;

остатки заполнены;

формулы вроде работают.

А потом выясняется:

часть товаров продаётся с неправильной маржой;

менеджеры работают по старым ценам;

на сайте уже лежат не те цены или остатки;

в отчёте цифры не сходятся с реальностью.

Вот почему ручная работа с прайсами почти всегда приводит к ошибкам.

Не потому что люди невнимательные.

А потому что сам процесс слишком хрупкий.

Прайсы приходят как попало.

Один поставщик прислал Excel.

Другой — CSV.

Третий поменял порядок колонок.

Четвёртый обновил только часть ассортимента.

Пятый добавил новые артикулы.

Где-то цена с НДС.

Где-то без НДС.

Где-то остаток указан как “много”, а не конкретным числом.

Где-то артикул похож на старый, но это уже другой товар.

И всё это кто-то должен руками свести, проверить, почистить, пересчитать и загрузить дальше.

На маленьком объёме это ещё можно удержать.

Но когда товаров тысячи, поставщиков много, а цены меняются регулярно, ошибки перестают быть исключением.

Они становятся вопросом времени.

Где-то не протянулась формула.

Где-то данные вставили не в тот столбец.

Где-то подтянулся старый прайс.

Где-то артикул совпал не с тем товаром.

Где-то закупочная цена изменилась, а продажная осталась прежней.

Где-то остаток есть у поставщика, но в системе он всё ещё “ноль”.

Самое неприятное — ошибка редко остаётся в одном месте.

Неправильная цена из прайса уходит дальше:

— на сайт;

— в CRM;

— в 1С;

— на маркетплейс;

— в коммерческое предложение;

— в отчёт по марже;

— в расчёт акции.

И потом команда разбирается уже не с причиной, а с последствиями.

Почему клиенту назвали одну цену, а на сайте другая?

Почему товар продали почти без прибыли?

Почему позиция выпала из продажи, хотя была в наличии?

Почему закупка приняла решение по старым данным?

Почему отчёт показывает странную маржу?

На практике проблема обычно не в том, что бизнесу нужно “ещё внимательнее проверять руками”.

Наоборот.

Ручной контроль уже не вытягивает.

Прайсы нужно не просто открывать и просматривать глазами.

Их нужно превращать в процесс:

— собрать данные;

— проверить структуру;

— сравнить с прошлой версией;

— найти подозрительные изменения;

— подсветить ошибки;

— пересчитать цены по правилам;

— передать дальше только проверенные данные.

Особенно это важно в e-commerce, автозапчастях, маркетплейсах и B2B-продажах.

Там цена зависит не от одной ячейки, а от всей связки:

поставщик → закупка → остаток → наценка → конкурент → маржа → правило → канал продаж

Если ломается одна часть, ошибка начинает тянуть за собой весь процесс.

Поэтому ручная работа с прайсами опасна не сама по себе.

Опасно то, что проблему часто замечают слишком поздно.

Когда товар уже продан не по той цене.

Когда клиент уже получил неверное предложение.

Когда маржа уже просела.

Когда менеджеры уже неделю работают по старым данным.

Хороший процесс должен показывать не просто:

“Прайс загружен”.

А:

что изменилось;

где есть риск;

какие цены выглядят странно;

где просела маржа;

что нужно проверить до выгрузки;

какие данные можно спокойно отправлять дальше.

Прайс — это не просто таблица.

Это входная точка для продаж, закупок, ценообразования и аналитики.

Если на входе хаос, дальше он только размножается.

Поэтому работа с прайсами — это не ручное обновление файлов.

Это контроль данных.

Без вечного “какой файл актуальный?”

Без проверки тысяч строк глазами.

Без ситуации, когда одну ошибку нашли только после того, как она уже испортила продажи.

Если прайсы уже стали источником постоянных ручных проверок — возможно, проблема не в людях.

Проблема в том, что процесс давно вырос из ручного режима.

Показать полностью

Бизнес Маркетинг Автоматизация Искусственный интеллект Парсинг Текст Длиннопост

Аноним

Любопытно было бы скормить пикабушку ИИхе⁠⁠

1 месяц назад

Появилась идея сделать определенный срез по информации на портале с учетом всего времени его существования... Этот ресурс давно накопил информации не малое количество. Последний гпт уже неплохо умеет в анализ. Что бы на все это сказал ИИ?

Уж больно любопытно стало :))

Подскажите как это реализовать.

Какие бы вопросы интересовали именно вас?

Искусственный интеллект Парсинг Любопытство Текст

minzent

Лига потребителей

Сервис

15 лет парсю интернет — и наконец сделал кое-что для себя⁠⁠

Всю карьеру я собираю данные для других. Пишу парсеры, качаю данные, строю пайплайны. Клиенты знают цены конкурентов в реальном времени, отслеживают остатки на складах, мониторят позиции в выдаче. Всё это — для бизнеса.

Для себя — никогда.

А сценарий знакомый: закинул товар в корзину, думаешь — куплю или нет, приглядываюсь. Многие как и я сам, вообще используют корзину как избранное — висит там десяток товаров неделями, пока не созреешь. Заходишь через неделю, а там уже другая цена. Выросла? Упала? Это вообще скидка или просто так написано?

Хотя идея одного инструмента давно крутилась в голове. Человек с профдеформацией парсера не может просто купить ноутбук-телефон-термос. У него чешутся руки.

Идея витала в воздухе, но всё не складывалось — то времени нет, то задача казалась слишком очевидной, чтобы за неё браться. А потом звёзды сошлись, и я сел писать расширение для Chrome. Без стартап-амбиций — просто чтобы видеть историю цены прямо на странице корзины.

Принцип простой: закидываешь товары в корзину и время от времени заходишь на её страницу — плагин сам соберёт актуальные цены и сохранит локально в браузере. Перед заказом мы всё равно туда заходим, ну или можно кликнуть на кнопку плагина — там всё собрано в одном месте.

Такая схема выбрана не случайно. Централизованно собирать цены всех товаров для всех магазинов — это нереально дорого и никогда не окупится. А так — работает на любом магазине, ничего лишнего.

Сейчас поддерживаются все основные: Озон, Вайлдберриз, Яндекс Маркет и другие. А ещё Tasty Coffee — просто потому что сам покупаю там кофе и хочу знать когда выгоднее брать. Если нужен какой-то конкретный магазин — пишите в комменты, добавлю.

Пользуюсь сам. Несколько раз уже видел, как «скидка» на распродаже — это просто цена, которая была две недели назад, а до этого была ниже. Приятно не быть лохом.

Залил в Chrome Web Store, назвал TonyCartoni. Неожиданно дали Featured badge — видимо, не один я так думаю о ценах на маркетплейсах.

Показать полностью

[моё] Маркетплейс Интернет-магазин Парсинг OZON Wildberries AliExpress Текст

HooppyService

Как с помощью парсинга и AI быстро вырастить Telegram-канал: инсайты от создателя автопостинга⁠⁠

3 месяца назад

Я основатель Hooppy - сервиса автопостинга, через который работает более 5 000 Telegram-каналов. Это даёт доступ к реальной статистике изнутри: частоте публикаций, источникам контента и реакции аудитории в первые часы после выхода постов. На такой выборке хорошо видно, какие инструменты и подходы действительно дают рост, а какие не влияют на динамику, несмотря на популярность.

Ниже - суть из аналитики: конкретные механики и рабочие решения, которые напрямую влияют на рост Telegram-канала.

Что такое парсинг и зачем он нужен

Парсинг - это автоматический сбор постов из чужих каналов по заданным параметрам. Вы подключаете источники: каналы конкурентов, смежные ниши, крупные паблики в Instagram, Telegram, ВКонтакте и других соцсетях. Система мониторит их на фоне и каждый день выдаёт список постов, отсортированных по охвату за последние 24-48 часов. Вы видите только то, что реально зашло аудитории - без ручного скроллинга и догадок.

Это не про «утащить чужой контент» - это про работу с уже подтвержденным спросом. Увидели пост, который резко рванул по цифрам - адаптировали под свою аудиторию и опубликовали (2-3 минуты работы). Именно так растут каналы, которые не придумывают темы с нуля, а используют данные.

Конкретный пример:

Пост IGN в Instagram про отсылки к комиксам в трейлере «Человек-паук: Новый день» резко пошёл в рост - почти 90 000 лайков, сотни комментариев и тысячи репостов. Мой сервис Hooppy сам зафиксировал всплеск, подтянул пост и без моего участия опубликовал его в Telegram-канал.

Пост в Инстаграме

Результат: почти 42 000 просмотров. Спустя 4 дня после публикации поста в моём Telegram - канале.

Результат в Телеграме

Никакой магии - всё сработало автоматически через Hooppy. Сервис сам нашел релевантный пост, сделал рерайт с английского на русский и сразу адаптировал текст под стиль моего канала, после чего обработал и опубликовал его без моего участия.

В этом и есть суть парсинга: использовать то, что уже доказало свою эффективность, и масштабировать результат.

Как я использую парсинг: от чужого контента до готового поста

Всё начинается с настройки источников. Я указываю конкретные страницы, которые хочу мониторить, выбираю соцсеть и метод поиска - по страницам или хештегам. Здесь же сразу выставляю фильтры: какие типы вложений брать, что игнорировать в тексте, как обрабатывать материал перед публикацией.

Настройка источника в Hooppy

После этого открывается лента. Все посты собраны в одном месте, рядом с каждым сразу видна статистика: лайки, комментарии, просмотры. Именно здесь я нашёл тот самый пост IGN - после сортировки по лайкам он сразу оказался наверху и бросился в глаза.

Лента найденных постов

Дальше - открывается редактор. Текст и все медиафайлы уже подгружены. Я выбираю площадки для публикации - в моём случае Telegram и Instagram одновременно - и при желании ставлю отложенное время.

Окно копирования поста

Но публиковать оригинальный англоязычный текст в русскоязычный канал - плохая идея. Здесь в дело вступает встроенный ИИ.

Я просто прогоняю пост через встроенный ИИ прямо в редакторе: он переписывает текст под мой стиль, переводит и делает его живым. На это уходит полминуты - на выходе уже готовый, нормальный текст под мою площадку,

ИИ-редактор с запросом

Кроме перевода и рерайта, ИИ умеет сокращать или расширять текст, добавлять хештеги, смайлы, а также разбивать на абзацы.

Весь процесс - от момента, когда я увидел пост в ленте, до нажатия кнопки «Опубликовать» - занимает меньше трёх минут.

Как выбирать источники для парсинга

Ошибка большинства каналов - без разбора добавлять в мониторинг конкурентов, крупные каналы и случайные популярные аккаунты, а дальше надеяться, что система сама начнет приносить сильные темы. На практике так не работает. Парсинг дает результат только тогда, когда у вас правильно собрана база источников. Иначе в ленте будет либо мусор, либо контент, который уже везде разошелся.

Первое, на что стоит смотреть, - близка ли динамика канала к вашей. Миллионники здесь плохой ориентир: у них другая аудитория, другой уровень доверия и совсем иной масштаб охватов. То, что хорошо заходит у них, у небольшого или среднего канала может не сработать вообще. Поэтому лучше брать источники в 5-15 раз крупнее своего. Если у вас 1 000 подписчиков, ориентируйтесь на каналы с 10-20 тысячами и стабильными просмотрами. Это ближе к вашей реальности.

Вторая важная вещь - фильтр по просмотрам. Без него парсинг быстро превращается в свалку. Вы начинаете видеть всё подряд: проходные посты, случайные публикации, слабые форматы, которые ничего не дали даже у первоисточника. Чтобы искать вирусный контент, нужен не просто поток постов, а отбор по реакции аудитории. Но здесь нельзя ставить один и тот же порог для всех.

Если у вас новостной канал, логика одна: скорость важнее доказанного охвата. В новостях не всегда есть смысл ждать, пока пост наберёт просмотры за 24 или 48 часов. Пока вы дождетесь подтверждения, тема уже устареет. Поэтому для новостных каналов важнее фильтр по свежести: здесь решает скорость, а не охват.

Если канал нишевой - про инвестиции, маркетинг, недвижимость, технологии или бизнес, - важен уже не темп, а подтвержденный интерес к теме.. В таких темах хорошо работают посты, которые за первые сутки собирают уверенный охват. Это показывает, что тема действительно зацепила аудиторию

В случае с авторскими каналами одних цифр по просмотрам уже мало. Далеко не каждый популярный пост можно переносить в свой формат. В авторских каналах важен не только сам инфоповод, но и подача, позиция, тон, конфликт, личность автора. Поэтому здесь нужно смотреть не просто на просмотры, а на то, какие темы вызывают сильный отклик именно как мнение. Иначе можно взять тему, но не понять, за счёт чего она сработала.

Отсюда вытекает ещё одна ошибка - мониторить только прямых конкурентов. Когда все смотрят друг на друга, в ход идут уже пережеванные темы. Сильные темы чаще приходят не напрямую из вашей ниши, а из смежных направлений. Канал про инвестиции часто находит удачные темы не только в инвестиционных пабликах, но и в бизнесе, стартапах, макроэкономике, личных финансах, психологии денег. Канал про маркетинг - в e-commerce, продажах, продукте, медиа и founder-контенте. Канал про медиа или Telegram - в creator economy, YouTube, Instagram, digital-рекламе и платформах монетизации. Смежные ниши часто дают тему раньше, чем она становится мейнстримом именно в вашей категории.

Отдельно стоит сказать про иностранные источники. Англоязычный сегмент часто отрабатывает тему раньше: сначала она вспыхивает в Twitter, Instagram, Reddit, LinkedIn или YouTube Shorts, потом доходит до локальных Telegram-каналов, и только после этого начинается массовое копирование в русскоязычном сегменте. Разница не всегда огромная, но даже 7-14 дней форы уже дают преимущество. За это время можно не просто переписать чужую тему, а первым адаптировать её под свою аудиторию и собрать основной охват до того, как рынок перегреется.

Но здесь важно понимать разницу между “источник популярный” и “источник полезный”. Полезный источник - это не тот, где много подписчиков. Это тот, откуда регулярно проходят посты, которые соответствуют вашим фильтрам и реально дают идеи. Если канал выглядит крупным, но за неделю не дал ни одного годного сигнала, он бесполезен. Если небольшой источник стабильно приносит сильные темы, он ценнее десятка распиаренных пабликов.

Поэтому база источников - это не разовая настройка, а постоянная работа. Каналы выгорают, меняют тему, теряют темп и со временем перестают давать сильный контент. (Их нужно регулярно пересматривать.) Смотрите не на подписчиков, а на последние 10 постов. Если просмотры стабильные и через фильтр регулярно что-то проходит, источник оставляете. Если охваты скачут, контент просел или за две недели не было ничего полезного - удаляете и ищете замену.

Именно здесь многие и просаживают парсинг. Один раз собирают базу и потом месяцами в нее не заходят. В результате мёртвых источников становится всё больше, а сильных сигналов - всё меньше. Рабочий подход простой: раз в месяц проходиться по базе и убирать всё, что больше не даёт результат.

Для большинства каналов рабочая схема такая: собираете 20-40 источников, смешиваете прямую нишу, смежные темы и иностранные аккаунты, ставите нужные фильтры и раз в месяц чистите базу. Тогда парсинг начинает приносить не просто чужие посты, а темы, которые уже пошли в рост или только начинают разгоняться.

Например, если канал про инвестиции следит только за другими инвестиционными каналами, он почти всегда приходит к теме поздно. К этому моменту её уже обсудили и разогнали. Другая картина - когда в источниках есть не только своя ниша, но и бизнес, макроэкономика, финтех, личные финансы и англоязычные аккаунты. Тогда тему можно заметить на раннем этапе, когда она только начинает повторяться в смежных источниках.

В этом и разница: сильный парсинг ищет не просто популярные посты, а ранние сигналы. Выигрывает не тот, у кого больше источников, а тот, кто понимает, какие из них действительно двигают тему вперёд.

Как адаптировать чужой пост, не нарушая авторских прав

Это важный момент, который многие игнорируют.

Копипаст – это нарушение авторских прав и быстрый бан. Адаптация – нормальная практика, которой пользуются все медиа без исключения.

Что значит адаптировать:

Переписать своими словами
Добавить собственный комментарий или кейс
Сменить угол подачи под свою аудиторию
Добавить актуальный контекст

Именно для этого я встроил в свой сервис Hooppy рерайт через ИИ. Нашел пост в ленте парсинга - нажал одну кнопку - ИИ переписал текст за 30 секунд. Я добавляю 2-3 предложения от себя, и пост готов к публикации прямо оттуда же. Итого: 2-3 минуты против 20-30 при работе руками.

Кросспостинг: почему один пост должен выходить везде

Telegram - отличная точка старта. Но если публиковать только там, вы упускаете площадки, которые могут давать такой же или даже больший объём трафика.

Смысл простой: один и тот же пост должен появляться сразу в нескольких местах - ВКонтакте, Instagram, YouTube. Речь не о том, чтобы делать больше контента - а о том, чтобы выжать максимум из уже готового.

Проверяется быстро. Пока пост выходит только в Telegram - охват ограничен одной платформой. Как только он начинает автоматически дублироваться в другие соцсети - общий охват растет, без дополнительной работы.

С видео это еще заметнее. С помощью Hooppy один короткий ролик можно сразу отправлять в Shorts, Reels и клипы, и он начинает жить сразу в нескольких алгоритмах. (Настройка делается один раз.)

5 шагов к росту показателей вашего Telegram канала

1. Найдите каналы конкурентов крупнее вашего. Подключите их в Hooppy как источники для мониторинга. Не изобретайте велосипед - берите то, что уже набрало просмотры у других.

2. Настройте парсинг с порогом просмотров Только посты, которые зашли аудитории. Всё остальное поможет отсечь Hooppy.

3. Кросспостинг на все площадки Один пост - ВК, Telegram, Instagram. Охват в три раза больше.

4. Два поста в день в одно время.

5. Три недели не меняйте ничего. Алгоритму необходим ритм.

Почему Telegram-канал стоит на месте

По опыту анализа каналов: большинство буксует из-за одного - контент каждый раз делают с нуля. Это быстро выматывает, появляются паузы, и канал теряет темп.

У Telegram нет отдельной «оценки качества текста». Алгоритмы смотрят на базовые сигналы:

регулярность публикаций
реакцию аудитории в первые 2–3 часа

Если канал несколько дней молчит, а потом вываливает серию постов - это выглядит как нестабильность. В итоге охваты проседают, даже если контент хороший.

Это одна из функций Hooppy - дальше всё сводится к контролю и масштабу

Помимо этого, в Hooppy доступны расписание публикаций, RSS, геометки для ВК, Instagram и Facebook, а также генерация постов через ИИ. Отдельно отмечу DeepSeek - выбор сделан на основе сравнения. Почему он, а не ChatGPT или Gemini - уже разобрал в прошлой статье. И ещё ряд инструментов, о которых не стал расписывать. Это уже не про базовые функции, а про системный рост. Такие вещи становятся понятны только в работе.

Сюда приходят не за «попробовать». Подключаются те, кому нужны точные данные, скорость и инструменты без ограничений - владельцы каналов и проектов, которые считают метрики и выстраивают рост. И таких пользователей с каждым месяцем становится больше.

Если вы здесь - значит, вы не просто смотрите, а ищете решение. Можете посмотреть это в работе на hooppy.ru - базовая настройка занимает около 15 минут.

Показать полностью 7

[моё] ChatGPT IT Парсинг Искусственный интеллект Telegram Telegram каналы Кросспостинг Постинг Instagram YouTube Rss DeepSeek ВКонтакте Длиннопост

werwe

Ответ на пост «Закон об ИИ: Конец "Дикого Запада" и новая цифровая сделка»⁠⁠1

3 месяца назад

Бизнес обяжут по первому требованию (если это предусмотрено законом) переключать клиента на живого оператора.

Первая за долгое время хорошая инициатива. Надеюсь ушлепки из всяких Яндексов и Сберов не прогнут законодателей, это нужно принимать, причем как можно быстрее.

У нас бизнес, к сожалению, не умеет в саморегуляцию и ответственность. У них только отчёты в глазах, сколько сэкономили на "внедрении ии". Я тут месяц назад в поддержку Сбера писал, это просто издевательство. Еле пробился через бесполезного бота. В голове не укладывается, как поддержка крупного БАНКА может так работать? Ее по сути нет. Не можете работать нормально - пускай государство даст вам пинка, ушлепки.

Искусственный интеллект Законопроект Маркировка Законодательство Будущее Право Юриспруденция Яндекс ВКонтакте Сбербанк Аналитика Парсинг Текст Защита прав потребителей Обман клиентов Жадность Служба поддержки Ответ на пост

Ilnur.B

Закон об ИИ: Конец «Дикого Запада» и новая цифровая сделка⁠⁠1

3 месяца назад

Вышел законопроект об ИИ, вступление которого намечено на сентябрь 2027 г. Но если прочитать текст целиком, становится ясно, что этот закон легализует кражу контента для одних и ломает фундаментальные алгоритмы продаж для других. Фактически, это первая попытка переписать правила игры и заключить новый общественный договор в цифровой среде.

Закон впервые лезет практически во все серые зоны, в которых мы привыкли работать:

Маркировка контента перестает быть доброй волей. Платформы обяжут внедрять автоматические детекторы (ст. 12 ч. 4), а обычным пользователям будет грозить ответственность за затирание "водяных знаков" (ст. 12 ч. 7). Если алгоритм пропустит дипфейк без плашки — отвечать будут все по цепочке.

Разработчикам ИИ теперь легально разрешили пылесосить чужой контент для обучения моделей без согласия авторов (ст. 13 ч. 5). Авторов просто лишили права на защиту ради прогресса ИИ, хотя, справедливости ради, до этого парсили и так без спроса.

Вводится запрет на использование ИИ для эксплуатации уязвимостей человека и воздействия на поведение (ст. 3 п. 14, ст. 10 ч. 2). Если норму не пересоберут только под LLM, то под удар попадают все фундаментальные рекомендательные алгоритмы Яндекса, Сбера и ВК, эксплуатирующие срочность в такси или эмоции в рекламе.

Гражданам дают право на отказ от ИИ (ст. 9 ч. 3). Бизнес обяжут по первому требованию (если это предусмотрено законом) переключать клиента на живого оператора. С одной стороны это понизит произвол, но с другой — открывает портал для потребительского экстремизма, так как регламента проверки человечности нет, и пользователи будут массово парализовать работу поддержек. Кто будет контролировать, что это реальный человек, а не ИИ с другим промптом, и как это реализуют — непонятно.

Вводится право на прозрачность: вы будете знать, когда решение по вам принял алгоритм (ст. 9 ч. 2). И здесь же заложена бомба — право на досудебное обжалование (ст. 9 ч. 4). Это значит, что госорганам и компаниям с госучастием придется как-то объяснять логику «черного ящика», что технически почти невозможно.

Уморительным показалось введение требований к ИИ по учету духовно-нравственных ценностей (ст. 4 п. 6). Кто и как будет это отслеживать? Есть риск, что это превратится в цензуру как в условном DeepSeek, когда ничего плохого нельзя генерировать про Китай.

Важно понимать, что сейчас это только проект. До сентября 2027 года его будут не раз переписывать под настроения общества и бизнеса и под давлением лоббистов. Например, то же ограничение запрета на манипуляции, чтобы оно распространялось не на весь ИИ, а только на LLM. К тому же есть риски, что бюрократия и крупные игроки просто не позволят предоставляемыми государством льготами (доступ к электричеству и суперкомпьютерам) пользоваться другим, менее крупным игрокам.

Это сложный баланс, а не игра в одни ворота. Государство дает бизнесу право пылесосить чужой контент и льготы. Бизнес взамен берет на себя тотальный контроль и ответственность за безопасность. Люди же получают защиту от манипуляций ценой окончательной потери приватности своего контента. Вопрос лишь в том, не окажется ли этот договор кабальным для обычного пользователя.

———

Следите за обновлениями в канале в Telegram | Vk
🔥 В закрепе канала также можно забрать чек-лист по зачистке цифрового следа.

#искусственныйинтеллект #законопроект #маркировка #парсинг #законодательство #будущее #право #юриспруденция #российские_законы #яндекс #сбер #deepseek #вконтакте #аналитика

Показать полностью

[моё] Искусственный интеллект Законопроект Маркировка Законодательство Будущее Право Юриспруденция Яндекс ВКонтакте Сбербанк Аналитика Парсинг Текст

user11657113

Как спарсить данные с сайта в гугл таблицу⁠⁠

3 месяца назад

Здравствуйте, добрые люди помогите, нужно спарсить ЦЕНУ предмета с сайта в Гугл Таблицу, чтобы она обновлялась автоматически, весь вечер пытаюсь, голова кипит, не получается.

Сайт, с которого нужно взять данные:

<!--noindex--><a href="https://pikabu.ru/story/kak_sparsit_dannyie_s_sayta_v_gugl_tablitsu_13790338?u=https%3A%2F%2Flis-skins.com%2Fru%2Fmarket%2Fcsgo%2Fak-47-nouveau-rouge-factory-new%2F&t=https%3A%2F%2Flis-skins.com%2Fru%2Fmarket%2Fcsgo%2Fak-47-nouveau-rouge-fac...&h=b65af0f78dece5a97ce4cd76a65327132761055c" title="https://lis-skins.com/ru/market/csgo/ak-47-nouveau-rouge-factory-new/" target="_blank" rel="nofollow noopener">https://lis-skins.com/ru/market/csgo/ak-47-nouveau-rouge-fac...</a><!--/noindex-->

https://lis-skins.com/ru/market/csgo/ak-47-nouveau-rouge-fac...

[моё] Google Таблицы Парсинг Компьютерная помощь Компьютер Программа Google Microsoft Excel Помощь

Посты не найдены

1 2 3 4 5 6 7 8 9 10 11

Что такое парсинг и зачем он нужен

Как я использую парсинг: от чужого контента до готового поста

Как выбирать источники для парсинга

Как адаптировать чужой пост, не нарушая авторских прав

Кросспостинг: почему один пост должен выходить везде

5 шагов к росту показателей вашего Telegram канала

Почему Telegram-канал стоит на месте

Это одна из функций Hooppy - дальше всё сводится к контролю и масштабу

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества