Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр «Рыбный дождь 2» — это игра-симулятор рыбалки, где вы почувствуете себя настоящим рыбаком на берегу реки, озера или морского побережья.

Рыбный дождь 2

Симуляторы, Спорт, Ролевые

Играть

Топ прошлой недели

  • AlexKud AlexKud 35 постов
  • Animalrescueed Animalrescueed 52 поста
  • Webstrannik1 Webstrannik1 50 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
1
News.Man
News.Man
1 год назад
Серия Новости...

RSS парсинг новостных лент⁠⁠

10.12.2023 г. по результатам RSS парсинга популярных новостных лент в России и частотного анализа полученного текста при помощи закона Ципфа, а также визуализации слов в виде облака, наблюдал такую картинку...

P.S. данная информация носит исключительно информационный характер, не является офертой или публичной офертой в соответствии с положениями ст. ст. 435, 437 ГК РФ!

RSS парсинг популярных новостных лент в России

RSS парсинг популярных новостных лент в России

Закон Ципфа иллюстрирует частотность распределения полученных слов

Закон Ципфа иллюстрирует частотность распределения полученных слов

Визуализация популярности полученных слов в виде облака

Визуализация популярности полученных слов в виде облака

Показать полностью 2
[моё] Новости Парсинг Rss Политика
0
Аноним
Аноним
2 года назад

Парсинг сайтов⁠⁠

Друзья, кто владеет информацией как новичку сделать парсинг сайтов? Есть сайт клиента, там есть список с адресами объектов, распределённым по вкладкам от 1 до 14. Вручную копировать, или выделять для вставки в эксель - не пойдёт, долго и вычищать много. Как можно этот процесс автоматизировать? Пробовал искать в гугле - но там уже программирование идёт. Не силён в этом.

[моё] Сайт Парсинг Текст
6
HolyVamp
2 года назад

125 страниц тега?⁠⁠

Хочу пособирать разную информацию с пикабу, но заметил, что хронология тегов ограничена в 125 страниц.

Это всё, дальше информация потеряна?

Есть возможность без лишних танцев с бубном достать посты 10-летней давности?

Пикабу Парсинг Текст
4
5
Аноним
Аноним
2 года назад

Парсинг сохраненок⁠⁠

Никто ещё не додумался написать парсер для сохранённых постов? Планирую удаляться, но сохраненок более 2000, жалко, а вручную очень долго

[моё] Парсинг Парсер Сохраненное Текст
5
skaynet25022022
skaynet25022022
2 года назад
Лига программистов

Парсинг заголовков объявлений⁠⁠

Доброго времени суток всем.

Я не являюсь профессионалом в сфере парсинга данных, лишь учусь этому ремеслу в свободное время и посредством производства подобного рода инструкций, хотел бы оставлять для себя же подробные объяснения, что и как работает. Этот материал будет полезен, как мне, так и тем людям, которым также интерес парсинг.

Буду благодарен любой критике, ваша обратная связь поможет мне делать дальнейший материал лучше.

Парсинг – это автоматизированный сбор данных и их систематизация. Сбор данных осуществляется с помощью специальных программ, что называются парсерами. Парсеры нужны для ускорения рутинной работы. Парсить можно, как поисковые фразы, так и цены конкурентов. Всё что угодно можно парсить.

Первый урок будет посвящен парсингу простых заголовков объявлений с html-страницы агро-ресурса.

Подключение необходимых библиотек

Для этого, нам понадобится.

1. Язык программирования Python

2. Модули Python:

– requests (для упрощенной работы с HTTP-запросами)

– BeautifulSoup (анализирует HTML и XML, создает дерево разбора для проанализированных страниц, что далее позволяет извлекать данные из HTML)

– пакет xml (модуль обработки xml)

Переходим к установке библиотек.

Для удобного написания кода на Python, буду использовать IDE ( это программное приложение, которое помогает программистам эффективно разрабатывать программный код. Оно повышает производительность разработчиков, объединяя такие возможности, как редактирование, создание, тестирование и упаковка программного обеспечения в простом для использования приложении.) под названием PyCharm.

1. Открываю PyCharm и перехожу во вкладку “Terminal”. Устанавливаем библиотеку requests командой “pip install requests”

2. Устанавливаем библиотеку BeautifulSoup командой “pip install BeautifulSoup”

3. Устанавливаем пакет xml

Отлично. Все необходимые библиотеки установлены, можем начинать.

Определяемся с целью парсинга

Моей сегодняшней целью является одно из названий объявлений на сайте АгроМер.

Пишем код

Далее прилагаю скриншот кода. Постарался к каждой строке кода дать соответствующий комментарий, чтобы было понятно, что делает каждая строка.

Дополнительно разбираемся с кодом

Как видим, получилось вывести заголовок “Подсолнечный шрот”. Опять же, для понимания, прошу обратить внимание на строку № 8.Нужно понять, почему именно мы ведем обращение по тегу ""div" и классу “product-card__name”.Открывем код страницы, наведя курсор мыши на заголовок “Подсолнечный шрот” и нажав “Inspect”, на русском это будет команда браузера “просмотреть код”

Как видим, искомому нами заголовку “Подсолнечный шрот” соответствует именно тег “div” и класс “product-card__name”, и именно метод “find” (строка кода №8) позволяет найти на странице необходимые нам элементы HTML-страницы.

Надеюсь, разбор получился понятным. Думаю, эта инструкция поможет мне вспомнить основы при необходимости и вам, если вам также интересен парсинг.Далее, буду также изучать парсинг подробнее и писать новые инструкции. Уверен, моя первая инструкция возможно полна недочетов, но со временем буду стараться для своих читателей делать их лучше и понятнее.

Мой канал в телеграмм

Если мануал показался вам интересным, то буду благодарен за подписку на мой

канал IT-старт t.me/it_begin

где я также публикую обзоры технической литературы и полезную информацию как для действующих, так и для начинающих программистов

Также публикую обзоры книг и интервью на моём сайте https://russia-it.ru

Показать полностью 7
[моё] Программирование Обучение Программист IT Разработка Парсинг Сайт Python Длиннопост
13
achodomasidet
achodomasidet
2 года назад

Вопрос к IT спецам про парсинг цен⁠⁠

Не топите в минусах плиз ибо эта тема мне кажется будет многим интересна кто часто путешествует (или хочет путешествовать). Суть такая:
Есть вопрос к людям из it. Я уже задавал нескольким знакомым, но точного ответа так и не получил. Возможно ли, сделать приложение (программу, плагин для браузера) которая будет отслеживать цену на авиабилет на конкретное направление (например Москва - Владивосток) и при попадании в низкий сегмент цены, получать уведомление. На авиасейлс можно делать такую штуку но к сожалению только на конкретную дату. Мне же в целом интересно попасть во Владивосток например,когда угодно, важно что не за конский ценник. Я примерно понимаю как это технически происходит, что-то в виде запросов на сайт каждые 3 например часа и с возвратом нужной инфы. Также я точно знаю что подобная схема давно работает в инвестировании + на сайте ebay при работе со ставками. То есть это уже работает. Подскажите насколько сложно это сделать? Кто что думает?

IT Парсинг Вопрос Программа Текст
15
DELETED
2 года назад

Парсинг - законно ли это⁠⁠

Парсинг - законно ли это

Парсинг данных является важной технологией, которая позволяет автоматизировать сбор и анализ информации на веб-сайтах. Он может быть полезен во многих областях, начиная от маркетинга и исследований рынка, до научных исследований и анализа данных.

Виды парсинга

- Поиск информации о конкурентах и их продуктах

- Сбор данных для анализа рынка и оценки потенциальных возможностей

- Извлечение информации из социальных сетей и других онлайн-платформ

Однако, необходимо учитывать законодательство и правила использования данных. Парсинг данных может быть незаконным, если он нарушает авторские права или нарушает права на конфиденциальность. В некоторых случаях, для сбора данных необходимо получить разрешение от владельца сайта. При выполнении парсинга данных важно учитывать не только законодательство, но и этические аспекты использования данных.

Несмотря на все преимущества, парсинг данных может стать причиной юридических проблем, если он нарушает законы и правила использования данных.

В целом, парсинг данных является законным, если он выполняется в соответствии с законодательством и не нарушает авторские права. Но это не всегда просто. Например, если сайт, с которого собираются данные, запрашивает ввод капчи, то автоматический сбор данных с такого сайта может быть запрещен.

Кроме того, законодательство и правила использования данных могут различаться в зависимости от страны и сферы применения парсинга данных. В некоторых случаях, для выполнения парсинга данных необходимо получить разрешение от владельца сайта. В других случаях, можно использовать данные, которые являются общедоступными.

При этом, важно помнить, что выполнение парсинга данных в соответствии с законодательством не означает, что такой сбор данных является этичным. Например, сбор конфиденциальных данных без согласия их владельца может нарушать личные права и привести к негативным последствиям.

В общем, парсинг данных является мощным инструментом, который может помочь в решении различных задач. Однако, для того чтобы быть полезным и законным, необходимо соблюдать определенные правила и следовать законодательству. При этом также важно учитывать этические аспекты сбора и использования данных.

Показать полностью
Парсинг Данные Информация
2
37
DobleAncho
DobleAncho
3 года назад
Доноры

Статистика DonorSearch⁠⁠

На замечательном портале DonorSearch есть рейтинг активных доноров.

Мне стало любопытно покрутить их статистику, и я выкачал под неё первичные данные.

Всего в рейтинге на конец октября почти 9 тыс. человек, из них порядка 300 могут быть почётными донорами (точно сказать сложно).

Для сравнения: в России порядка 600 тыс. почётных доноров, т.е. DonorSearch охватывает доли процента. Не возьмусь судить, насколько репрезентативна их статистика (наверное не очень), но другой в открытом доступе я не нашёл.


Итак,

- Распределение мужчин и женщин почти 50-на-50.

- Средний возраст донора - 31 год и 33 года соответственно.

- В среднем у одного донора, который зарегистрировался на сайте, 7,6 донации при стандартном отклонении 14.

- Больше всего доноров из Москвы, 22%. На втором месте Питер (10%), затем Татарстан (8,4%), Московская (4,9%) и Свердловская области (4,1%).

- Больше всего доноров с именем Александр (4,5%), Анастасия (3,4%), Дмитрий (3,2%) и Сергей (3,2%).


А теперь вкусное, ради чего всё затевалось:

Статистика DonorSearch

Как говорится, найдите себя)

Если вам интересна ещё какая агрегированная статистика – пишите, выложу.


И коллеги из @DonorSearch, спасибо за ваш классный ресурс! Давайте кооперироваться: у меня много идей для новых статистических статей на вашем портале (в т.ч. по данным, которые вы не расшариваете, а выкачать их сложно).

Показать полностью 1
[моё] Донорство Кровь Статистика Группа крови Резус-фактор Донор Почетный донор Парсинг Данные Москва Санкт-Петербург Татарстан Московская область Свердловская область
4
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии