Анализ новостных лент на основе RSS парсинга
12.04.2024 г. я продолжил RSS парсинг популярных новостных лент в России. По результатам наблюдал такую картинку...
Облако слов...
12.04.2024 г. я продолжил RSS парсинг популярных новостных лент в России. По результатам наблюдал такую картинку...
Облако слов...
Сила Пикабу! Прошло два года, и вот уже при поиске по словам "Парсер госзакупок" выдают две страницы парсеров, платных и бесплатных!
Пример интерфейса:
одно из предложений бесплатной программы
Даже в Битриксе24 теперь встроили парсер госзакупок!
Но всё равно никто документы не скачивает и не анализирует. Коды КТРУ тоже. Есть куда расти! Есть куда развивать бизнес-модель!
Есть у нас направление такое интересное - парсинг. Это когда компании хотят автоматически получать данные о ценах конкурентах или собирать какие-то данные с сайтов массово. Обычно это медцентры следят так друг за другом, всякие продавцы на маркетплейсах, торговые компании, производства отслеживают цены в магазинах и т.д.
Мы делаем такие системы сбора данных, которые потом заказчику или в таблице приходят или создаются личные кабинеты с данными и так далее. То есть чисто инструмент собственника бизнеса или маркетолога.
Но на прошлой неделе сдали интересный заказ: надо собирать цены конкурирующих мужских SPA салонов (около 20). Раз в неделю теперь у заказчика система собирает цены по таким салонам и выдает табличку, в том числе у кого какие акции, как изменились цены, добавили или убрали какие-то программы и так далее. Ну соответственно заказчик видит что конкретно поменялось, как изменили цену и пр.
Система выглядит так:
Ну а что, бизнес есть бизнес, маркетологи есть везде )
В чате был вопрос сколько можно в РФ зарабатывать на парсинге и анализе данных. Вот, см. картинку. Выручка и прибыль.
Уважаемый и более успешный конкурент. Легко найдете сайт по названию юр.лица. Правда у ребят больше продуктовый подход, а мы пока барахтаемся в проектном парсинге.
Крупнее нас в 3-4 раза (в части бизнеса по парсингу, так то у нас еще бизнесы есть). Молодцы, сказать нечего - нам есть куда стремиться. Но стремление только к продукту должно быть, ведь иначе наши издержки на команду растут пропорционально росту выручки. Вот, в феврале +2 программиста вывели.
p.s. рынок такой большой, что всем места хватит.
Русский ИТ бизнес (https://t.me/bezsmuzi)
Если вы решили заняться инвайтом сами, нужно знать ещё пару жирных нюансов.
Я надеюсь все понимают, что инвайтить со своих аккаунтов - плохая затея.
Аккаунты, которые вы покупаете, нужно высиживать как яйца аиста, аналогично делают и с чатами, чем дольше, тем лучше! В идеале, нужно создавать на них искусственную активность.
Свежий аккаунт может инвайтить 4 пдп в день, через день 8, 16 и дальше, лучше остановится на 25 - т.е нужно их ещё и прогревать в плане инвайта, максимум 30 пдп в день.
Аккаунт должен быть той страны, с которой вы работаете, хотя кто использует и другие.
Раньше, это было не важно, однако сейчас модерация работает на 3 головы выше и аккаунты улетают только в путь.
Прокси, да! Нужно использовать прокси страны аккаунта, если не хотите быстро потерять аккаунт и бана по айпи.
Траты и Расходники:
Аккаунт ру сегмента: 70-100р
Прокси, лучше использовать не статичный, за счёт чего один можно использовать на 2-3 аккаунта: от 100-500р (на пару дней и индивидуальный)
Чат с отлёжкой: 200-700р (цена зависит от времени отлёжки)
Боты на чат: от 150р за 1000 ботов
Софт или Сервис: от 750р до 50к
Желание ещё не пропало? Окей, идём дальше...
Софт или Сервис? Попробовать и протестировать можно в сервисе, благо там дают пробные 3-7 дней потыкаться, даже прокси предоставляют, останется только затарить аккаунты и чат.
Есть сервисы, где можно запустить целый конвейер, просто закидываешь деньги в кабинет и сервис автоматом тарит вам аккаунты и инвайтит на автомате, нужно только всё настроить.
Если говорить про софты, все они в основном корявые, хотя и выполняют свою функцию.
Корявые и дешёвые софты:
• Где-то нет выставления задержки перед инвайтом, а она сильно важна и как минимум должна пройти 1 минута, перед следующем инвайтом, иначе получаем бан аккаунта.
• Нет ограничителя по аккаунтам, придётся сидеть и отключать аккаунты вручную, при приглашении 20-25 человек на 1 аккаунт.
• Нельзя поставить прокси или нет автоматической смены.
• Можно подключить только до 5 аккаунтов.
Вот вроде бы и всё, за исключением одного лайфхака:
Ботов можно залить себе в отдельный чат и в дальнейшем благодаря им, можно прогревать свои аккаунты телеграм и не тратиться на новые заказы - просто переливаем их туда, куда нужно.
Если было полезно, поставь "в топ", по-братски!
Хороший инструмент в хороших руках и очень страшный в плохих.
Это как прийти к хирургу, который только закончил практику:
Я знаю, я всё видел, давайте сюда! Всё будет хорошо.
Обратившись к такому специалисту можно потерять: чат, канал, а бонусом ещё и свой телеграм аккаунт.
Первое - парсинг аудитории, обычно его делают по логике:
У нас тематика бизнес - значит надо пройтись по бизнес чатам.
Собирают весь шлак, где упоминается в названии ключевое слово, там попадаются пачки ботов и тонны не целевой аудитории, потому что в таких чатах - используют ту же логику.
Как делать правильно - вспоминаем всё что знаем о своей ЦА и где её найти + перечитываем пост про рассылку.
Второе - куда и как заливать?
Самые ужасные заливают прямо в ваш основной чат - если задача раскачать чат.
Если задача залить канал - создают чат, пост для перелива и льют туда.
Тут-то мы и можем получить.
Жалобы за инвайт могут перевалить за 20-30% от вашей общей аудитории - такое система наказывает.
Если чат свежеиспечённый, вероятность его удаления очень большая - система видит, чат создали для инвайта.
Первый пример:
Вася собрал плохую аудиторию, создал чат, начал инвайтить, 30% этой аудитории пожаловались на этот чат, потому что не ЦА и оффер говно = телеграм удалил этот чат и за одно аккаунт владельца.
Вася долго не думал и идёт создавать второй чат, третий и все они с ссылкой на ваш канал = система чует подвох и удаляет, в дальнейшем, к херам ещё и ваш канал - с вашей живой аудиторией.
Второй пример:
Петя, который масштабно зарабатывает на инвайте, имеет чаты с отлёжкой и знает где их можно достать.
Петя берет чат с отлёжкой в пару месяцев, а лучше лет, создаёт там пост для перелива и заливает туда 5000 ботов. Оставляет чат на пару дней. Петя ищет вашу ЦА и на третий день начинает инвайтить туда 500 человек.
Петя знает, если пожалуются все 500 человек, это будет всего 10% от всей аудитории - Петя молодец, Петя шарит!
Так же заливают и чаты:
Покупают старый чат, заливают ботов, ждут пару дней, начинают инвайтить живую аудиторию и никак иначе, после, чистят аудиторию.
-----------------------
Пробовали? Какие результаты?
Если смотреть статистику Яндекс Метрики - топ 1 по заходам в мой блог artydev.ru генерируют поисковые запросы на тему парсинга Тинькофф Пульс
Времена идут, а желающих алгоритмично просрать свои деньги сделать торгового робота и сказочно разбогатеть на основе инфы публикаций экспертов с пульса не убавляется
Без проблем, хотите залететь в мир алготрейдинга - лучше сделать этой сейчас, чем потом и на всю котлету
Описал в статье пример использования python библиотеки tpulse-py для сбора (парсинга) данных постов в пульсе, welcome!
Пост: https://artydev.ru/posts/parse-tinkoff/
__
artydev & Co
Подскажите, сведущие в вопросе люди, правильно ли считать волны постов с деаноном лучшим способом парсить информацию для агентуры с целью дальнейшей вербовки, кражи персональных данных, развода на деньги, взлома аккаунтов и прочего?
И пприкола ради ли они запускаются?