Рейтинги постов и теги
Продолжение Рейтинг постов на Пикабу
Здесь и далее рассматривались только теги, поставленные в постах 10 тыс. раз и более. Исключен NSFW (нет данных в предоставленной базе). "Вероятность +10(+1000) и больше" - это пропорция постов, имеющих данный тег и рейтинг которых больше +10 (+1000).
Как видно из таблицы посты с тегом "Негатив" - самая одобряемая категория на Пикабу. Посты с этим тегом собирают максимальное количество плюсов в среднем, причем с большим отрывом от других постов. Напомню, что все остальные посты набирают в среднем +6.
Более того, такие посты имеют максимальную вероятность набрать рейтинг +1000 и более. Вот топ тегов по этому показателю.
Анимешки отличаются тем, что практически гарантированно выходят в "горячее". Но при этом шанс получить +1000 у таких постов практически нет.
Вот топ тегов, дающих шанс получить за пост +10 и более. (Котики тоже в этом топе, но при этом у них есть какой-то шанс на +1000)
Теги, дающие постам минимальный шанс получить +10. Напомню, что в среднем (по всем постам) этот шанс равен 0.42.
Самые минусуемые и думаю самые противоречивые категории. С одной стороны, они лидеры по среднему количеству минусов, но с другой стороны, посты в этих категориях имеют хороший шанс попасть в горячее и даже получить +1000.
Рейтинг поста. Что лучше: текст, видео, фото, рисунок?
Продолжение поста Рейтинг постов на Пикабу
Графики на рисунке построены на основе анализа 10 тысяч и более Пикабу постов, имеющих соответствующий тег. Чем правее сдвинут график, тем чаще пост с тегом получает высокий рейтинг. Серым цветом показан график для всех постов (независимо от тега).
Посмотрим на “эффект тегов”, сравнив медиану рейтингов всех постов (без учета тега) с медианным значения постов с соответствующим тегом. Медиана всех постов равна +6 (пересечение горизонтальной линии на уровне 0.5 с серым графиком).
Посты с тегом “Текст” и “Видео” имеют медианы 1 и 2. Т.е. эти теги в среднем “отнимают” у поста 5 и 4 плюсика соответственно.
Теги “Рисунок” и “Фотография” имеют медианы 13 и 15. Наличие этих тегов добавляет к рейтингу поста +7 и +9.
Тег “Гифка”, в отличие от “Видео”, добавляет к рейтингу, причем довольно значимо +16
Чемпион среди этих тегов - “Комиксы”. Этот тег прибавляет 58 плюсиков к рейтингу поста.
Посмотрим на эффекты тегов с другой стороны - посчитаем вероятность того, что пост наберет рейтинг +10 и выше (выход в горячее). В среднем эта вероятность 42%. Чтобы увидеть это на графике проводим вертикальную линию в точке 10 до пересечения с серой кривой, получаем 0.58. Т.е. 58% вероятность получить 10 плюсиков и меньше. Cоответственно (100% - 58%) = 42% вероятность получить 10 плюсиков и больше.
Посты с тегами “Текст” и “Видео” имеют примерно по 34%. Т.е. теги снижают вероятность выхода поста в горячее на 10%.
Теги “Рисунок”, “Фотография”, “Гифка”,“Комиксы” увеличивают шансы на 15%, 17%, 23% и 32%.
Вывод - рисуйте комиксы и будут вам плюсики :).
Нужно оговориться, что все это в статистике называется “обсервационное” исследование. Оно не выявляет причинно-следственные связи. Однако может навести на размышления :).
Помогите объяснить новенькому
Я не очень разобрался в ресурсе, не до конца понял принцип рейтинга пользователей. Вот, в одном из постов, некто под ником @conte.Cagliostro, откровенно пишет: "хоть всю фабрику зови до пенсии минусовать будите" Мне действительно интересно стало, от куда у товарища такой высокий рейтинг, если мысли его, мягко сказать не соответствуют, коротким цитатам, юморных сносок, смешных фото и всего того, на чем он и подобные ему поднимают рейтинг? Может я не прав, извините заранее. Но честно, подобные рейтинги мне напоминают хвастовство бомжей возле помойки, кто больше отковырял в мусорке добра! Разницы ведь никакой. Один на помойке ищет вкусности, другой в интернете чужие мысли, творчество и идеи. И что один, что другой не прилагают к этому усилий - ковыряйся в свое удовольствие, а когда насобираешь добра можно и дулю крутить другим пользователям ресурса. Я новенький здесь, дочь друга рекомендовала этот сайт. Я понимаю, что не по статусу делать рекомендации @moderator, сайта. Но согласитесь, как бы вырос контент, если бы рейтинг рос не пропорционально плюсикам за украденную из интернета голую сиську и юморную цитату. А за нарисованную схему, вышитую своими руками игрушку, нарисованный коллаж, созданный рассказ и рекомендации к компьютерной периферии. Рейтинг должен основываться не плюсиками - колличеством подписчиков с тегом "мое". Может я не прав - поправите)
Рейтинг постов на Пикабу
Недавно я обнаружил Пикабу датасет, выложенный год назад. Он содержит записи о примерно 3-х миллионов пользователей, 7 миллионов постов и 154 миллионов комментариев. Там нет никаких персональных данных или детальной информации (например кто за какой пост голосовал), так что нет особого повода беспокоиться. Но он содержит интересный материал для анализа (спасибо @NeAdminPikabu, это действительно очень ценный материал).
Я решил его понемногу “майнить” и писать все интересное, что получится найти. Вот первая порция.
Я построил график кумулятивного распределения рейтинга постов на пикабу. График интересен тем, что поможет вам узнать, насколько хорош ваш пост.
Предположим пост получил +21. Ищем 21 на оси "Рейтинг" и по графику определяем, что примерно 70% постов (0.7) имеет на Пикабу рейтинг ниже. То есть ваш пост вошел в 30% лучших постов Пикабу (есть чем гордиться).
А если ваш пост получил -20, то это тоже своего рода достижение. По графику видно, что только 5% постов получают больше минусов чем ваш.
Еще на основе этого графика можно предсказать рейтинг вашего будущего поста на пикабу даже ничего не зная о нем.
Ваш будущий пост имеет шанс 50% получить рейтинг +6 и выше (синяя вертикальная линия). Вот такой забавный результат :). Я буду ссылаться на него, в последующих постах, где расскажу как можно повлиять на рейтинг в лучшую (или худшую) сторону.
Поиграем в бизнесменов?
Одна вакансия, два кандидата. Сможете выбрать лучшего? И так пять раз.