Рейтинг постов на Пикабу
Недавно я обнаружил Пикабу датасет, выложенный год назад. Он содержит записи о примерно 3-х миллионов пользователей, 7 миллионов постов и 154 миллионов комментариев. Там нет никаких персональных данных или детальной информации (например кто за какой пост голосовал), так что нет особого повода беспокоиться. Но он содержит интересный материал для анализа (спасибо @NeAdminPikabu, это действительно очень ценный материал).
Я решил его понемногу “майнить” и писать все интересное, что получится найти. Вот первая порция.
Я построил график кумулятивного распределения рейтинга постов на пикабу. График интересен тем, что поможет вам узнать, насколько хорош ваш пост.
Предположим пост получил +21. Ищем 21 на оси "Рейтинг" и по графику определяем, что примерно 70% постов (0.7) имеет на Пикабу рейтинг ниже. То есть ваш пост вошел в 30% лучших постов Пикабу (есть чем гордиться).
А если ваш пост получил -20, то это тоже своего рода достижение. По графику видно, что только 5% постов получают больше минусов чем ваш.
Еще на основе этого графика можно предсказать рейтинг вашего будущего поста на пикабу даже ничего не зная о нем.
Ваш будущий пост имеет шанс 50% получить рейтинг +6 и выше (синяя вертикальная линия). Вот такой забавный результат :). Я буду ссылаться на него, в последующих постах, где расскажу как можно повлиять на рейтинг в лучшую (или худшую) сторону.

Лига статистиков
29 постов81 подписчик