Логика Пикабу, или анализ статистики постов за 4 недели.
Коротая ночную работу в лаборатории, я решил начать писать научно-популярные статьи, объясняя простым языком сложные вещи из научной практики. Через некоторое время статья была готова и палец тянулся к кнопке: “Добавить пост”. Как вдруг возник вопрос:
Много ли людей увидят этот пост, если я его опубликую его в 4 утра, и вообще, как зависит популярность поста, от времени публикации?
Будучи технарём, я решил найти ответ подтверждённый вычислениями, а не пространными размышлениями, чем грешат многие социологи.
В качестве затравки покажу как распределено количество постов по рейтингу. Первая точка, обозначает количество постов с рейтингом от 20 до 120 и так далее.
Что бы ответить на поставленный выше вопрос, я провёл примитивный "временной анализ" или по-простому, посмотрел на рейтинг поста в зависимости от времени его публикации. Для этого решено было проанализировать посты с рейтингом от 20, которые были опубликованы в течении случайных 4 недель без праздников, прошедших в период с февраля по май 2016 года.
Через 20 минут, парсенья с бубном Пикабу, была получена примитивная Excel таблица в которой было два столбца, время публикации и рейтинг поста. Всего вышло 18 114 строк с суммарным рейтингом 12 986 719!
Для начала, решил построить зависимость числа опубликованных постов в зависимости от времени суток или дня недели. Время указанно по Московскому часовому поясу.
Как видно, самыми продуктивными у пикабушников являются периоды с 12:00 до 13:00 и с 20:00 до 21:00. Интересно, что в рабочее время публикуется больше постов чем вечером! В целом, разброс очень сильный. Оно и понятно, большая часть населения России живёт в 2 часовых поясах.
Что с днями недели?
Как видим, разброс маленький с небольшим преобладанием субботы. В воскресенье пикабушники предпочитают отдыхать, и им не до публикаций. Также заметен небольшой трудовой всплеск в понедельник, когда кол-во постов уменьшено.
А теперь, самая главная часть для кармодрочеров =). Посмотрим как зависит средний рейтинг от дня недели или времени суток.
В 5 часов утра пикабушники явно злые! Я тоже злой в 5 часов утра, но, благо, рядом ни кого нет. Удивительно, но самые высокие рейтинги получают посты, опубликованные в 9 часов утра. В 2 раза выше чем в 5:00! Допустим, 13 часовой всплеск можно отнести к обеденному перерыву. А дальше идут, совершенно мне не понятные, скачки с 23:00 до 2:00. Свои догадки напишите в комментариях.
Ещё до того, как я построил эту диаграмму, я не сомневался, чтов пятницу у людей наиболее позитивное настроение. А вот суббота, на против, сильно удивила. Она обладает самым высоким кол-вом постов, но при этом, самым низким средним рейтингом! Я без понятия как это объяснить, видимо это и есть Логика Пикабу.
Кроме среднего рейтинга, мне было интересно, когда появляются посты с очень высокими рейтингами. Для этого я построил график, показывающий долю постов с рейтингом от 4000 относительно остального количества собранных постов .
Поистине, 7 часов - продуктивное время! При этом, лидер средней оценки, 9 часов, отстаёт в 2 раза. Это отличная иллюстрация идеи о том, что лучшее в среднем не обязательно показывает самые лучшие варианты.
С днями недели получилось тоже интересно. Предлагаю вам самим подумать над интерпретацией. (По оси y доля постов)
В самом начале, был представлен частотный график рейтинга. Как видно, постов с низким рейтингом во много раз больше чем с высокими. Показательно, что в логарифмическом масштабе график, начиная с рейтинга 120, представляет прямую линию. Это ни что иное, как Экспоненциальное затухание, столь часто встречающееся в природе.
P.S. Думаю, каждый сделает свои выводы. Для себя я ответил на вопрос, в 4 часа публиковаться было очень плохой идеей =).
P.S.S. Если такой анализ вам интересен, то, возможно, сделаю более глубокую аналитику на годовом интервале и рассмотрю когда пикабушники любят читать длинные посты, а когда короткие.
Наука | Научпоп
7.7K постов78.5K подписчик
Правила сообщества
Основные условия публикации
- Посты должны иметь отношение к науке, актуальным открытиям или жизни научного сообщества и содержать ссылки на авторитетный источник.
- Посты должны по возможности избегать кликбейта и броских фраз, вводящих в заблуждение.
- Научные статьи должны сопровождаться описанием исследования, доступным на популярном уровне. Слишком профессиональный материал может быть отклонён.
- Видеоматериалы должны иметь описание.
- Названия должны отражать суть исследования.
- Если пост содержит материал, оригинал которого написан или снят на иностранном языке, русская версия должна содержать все основные положения.
Не принимаются к публикации
- Точные или урезанные копии журнальных и газетных статей. Посты о последних достижениях науки должны содержать ваш разъясняющий комментарий или представлять обзоры нескольких статей.
- Юмористические посты, представляющие также точные и урезанные копии из популярных источников, цитаты сборников. Научный юмор приветствуется, но должен публиковаться большими порциями, а не набивать рейтинг единичными цитатами огромного сборника.
- Посты с вопросами околонаучного, но базового уровня, просьбы о помощи в решении задач и проведении исследований отправляются в общую ленту. По возможности модерация сообщества даст свой ответ.
Наказывается баном
- Оскорбления, выраженные лично пользователю или категории пользователей.
- Попытки использовать сообщество для рекламы.
- Фальсификация фактов.
- Многократные попытки публикации материалов, не удовлетворяющих правилам.
- Троллинг, флейм.
- Нарушение правил сайта в целом.
Окончательное решение по соответствию поста или комментария правилам принимается модерацией сообщества. Просьбы о разбане и жалобы на модерацию принимает администратор сообщества. Жалобы на администратора принимает@SupportComunity и общество Пикабу.