58

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!»3

Пикабушечка любит интересные истории и расследования — их есть у нас! Оно посвящено потенциальной возможности манипуляции выходов постов в "Горячее" и формирования определенной повестки дня на Пикабу. Заваривайте чайку, кофейку, устраивайтесь поудобнее — и поехали!

Предыстория, на днях в коментах к одному из наших постов мы встретили пикабушника с размером не 49.5, а все 50. @shiftalt — настоящий ветеран Пикабу! На площадке он уже 9 лет, 6 месяцев, 3 недели и 3 дня, а это почти 5 000 000 минут (365 дней × 24 часа × 60 минут). За это время он успел накидать в панамку 3 924 001 минуса! 🚀

То есть все эти 9 лет он стабильно, каждый день и каждую ночь без выходных и праздников раздавал минусы со скоростью 1 минус в минуту! 😲

@Lebedun в комментариях нам подсказал, что такие интересные персонажи на пикабу не редкость и дал ссылку на пост 22 года, где уже поднималась эта тема: Ответ @Lebedun "Интересно, есть ли статистика - сколько плюсов в день ставят, самые активные плюсаторы/минусаторы, акк, пост и коммент?". На тот момент лидирующую позицию занимал @2tps, но он уже давно не активен. Позже, к нам в диалог вступил @kgam.tyhf, профессиональный автор, который уже долгие годы выкатывает интереснейшую информативную статистику о пользователях и о пикабу в целом. Мы обратились к его посту Как формируется рейтинг постов на Пикабу и кто это делает.

И вот на что мы хотели бы обратить внимание — на две очень важные детали:

  1. Ни для кого не секрет, что после публикации у постов есть определённое разгонное время. В среднем первые 30–60 минут решают судьбу поста: наберёт ли он популярность или утонет в бесконечности. (См. Рисунок 1.). Реакции (+/-) напрямую влияют на продвижение поста.

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Рисунок 1. График зависимости рейтинга поста от времени (в минутах). Цветом обозначены кривые для постов с различными финальными рейтингами: 0 — красная, 0–20 — черная, 20–50 — светло-зеленая, 50–100 — синяя, 100–1000 — фиолетовая, >1000 — зеленая.

2. Важным условием получения оценок и продвижения поста является наличие потенциальных читателей в момент публикации, которым этот пост зайдёт и которые его оценят. Ведь помимо интересной тематики, нужно ещё и попасть во время активности подходящей аудитории поста. Если публикация наткнется не на ту аудиторию — даже крутой пост рискует остаться незамеченным. Это логично и справедливо. Но вот тут-то и скрывается дьявол.
Рассмотрим среднюю аудиторию и среднее число оценок, которое они выставляют в сутки на Пикабу, рисунок 2.

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Рисунок 2. Серым изображено распределение числа оценок, а зеленым среднее число оценок в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки.

Вот что об этом пишет @kgam.tyhf

Понятно, что не все оценки этих пользователей поставлены постам в течение суток с момента их публикации. Но как мы помним из графика с маленькими столбиками (% плюсов и минусов, набираемых постами за 12, 24 и 48 часов), в зависимости от итогового рейтинга, за сутки посты получают от 70 до 80% всех своих финальных оценок.
Таким образом, речь идет о 10-12 тысячах пикабушниках, определяющих почти 2/3 рейтинга всего контента.

Чтобы осознать это, давайте перестроим эти графики вот в таком виде:

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Рисунок 3. Суммарное число оценок(слева), и доля этих оценок (справа) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки

Согласно данным графика выше, большинство пользователей (`~62%) ставят от 1 до 5 оценок в сутки (а если учитывать группу 5–10, то ~79%). Однако их влияние минимально — их удельный вес в общей системе оценок за сутки всего 6,5% (или 15% если брать диапазон 0–10).

Вот наибольший удельный вес ~43% имеет небольшая группа лиц — около 3.5% супер активных пользователей, которые ставят более 50 оценок в сутки.

Вы можете сказать, да они не смогут потопить или поднять пост своими минусами и плюсами, их мало и их могут забанить, их голоса могут не учитывать т.к. есть #comment_341525500


В счетчик плюсов/минусов постов, имеющих рейтинг менее 500, просто не записываются данные по истечению недели. Также не засчитываются оценки после 10-й, поставленная одним пользователем другому в течение последних 24 часов.

В профиле же пользователя эти поставленные оценки фигурируют.


Хитрость в том, что эти ограничения не важны. Для таких пользователей не имеет значения, ставят ли они оценки постам одного автора или разным — главное, что их бешеная активность может влиять на формирование популярной тематики на платформе и продвигать в топ определённых авторов.

Как это так, спросите вы? Суть в том, что они очень активы и у них огромный удельный вес ~43%. Ведь судьба поста решается в первые 30–60 минут. А их активность и вклад в оценки в этот момент существенно выше по сравнению с обычными пользователями, которые в среднем ставят ~5 оценок в сутки.

И самое интересное — не так важно, оценивают ли они твой пост или нет. Одним только бездействием (отсутствием любой оценки) они могут сильно сместить баланс голосов для свежих постов. Если пост не соответствует их повестке, они его просто проигнорируют — а значит, он не наберёт нужного импульса и дальше не пойдёт. Более того, вместо этого они раздадут плюсы постам, которые вписываются в их интересы, продвигая именно их в топ, задвигая их на второй план.

@kgam.tyhf утверждает, что на пикабу "существуют шедоу на оценки Теневой бан оценкам на Пикабу? Или как это называется? [Есть ответ]" и вероятно такие супер активные пользователи не могут оценивать посты или их оценки просто не учитываются. Мы актуализировали таблицу топ минусаторов из поста 22 года Ответ @Lebedun "Интересно, есть ли статистика - сколько плюсов в день ставят, самые активные плюсаторы/минусаторы, акк, пост и коммент?".

И вот что мы видим: наш @shiftalt прекрасно себя чувствует и продолжает активно минусить, оставаясь в топе этого рейтинга. Таблица основана на данных пользователей, засветившихся в 2022 году. В сутки он выдаёт 1777 минусов! Как видно, абсолютное число его минусов постоянно растёт, как и у других суперактивных пользователей.

Помимо минусаторов есть и супер активные плюсаторы. Сколько их всего? Судя по графику (Рисунок 2), таких пользователей около четырёх тысяч.

Возможно ли что пикабу не учитывает их голоса? Возможно! Или нет?

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Рисунок 4. главные минусаторы Пикабу

IT-юмор

6.9K постов53.2K подписчиков

Правила сообщества

Не публикуем посты:
1) с большим количеством мата
2) с просьбами о помощи
3) не относящиеся к IT-юмору

49
Автор поста оценил этот комментарий
ответный пост

В прошлом посте мы поднимали проблему влияния "супер активных пользователей", тех у кого не 49.5 по меркам пикабу, а все 50, на формирование контента в ленте "горячее". Их оценка или бездействие может играть существенную роль в искажении общего восприятия популярности постов. Т.н. "тирания меньшинства", небольшой группы активных участников доминирующей над большинством, сводящаяся к проблемам алгоритмической фильтрации. В коментах спрашивали, как можно попытаться решить эту проблему, давайте разбираться и предложим конкретные шаги решения.
Заваривайте чайку, кофейку, устраивайтесь поудобнее — и поехали!

Проблема в цифрах и её суть
Согласно статистике, отраженной в посте Как формируется рейтинг постов на Пикабу и кто это делает и приведенной на рисунке 1.

  • 62% пользователей ставят от 1–5 оценок в сутки (79% — если включить 5–10 оценок).

  • 3,5% пользователей ставят более 50 оценок в сутки (включая супер активных пользователей, о которых шла речь в предыдущем посте и роль которых туманна, т.к. вроде бы их оценки не учитываются #comment_242894369, но при этом в их профиле все равно видно изменения кол-ва, поставленных ими + и - #comment_341650409 ) доминируют, обеспечивая более 43% всех оценок.

Т.о. средний пользователь ( с его ~5 оценками) почти не влияет на систему (6,5–15% веса), а супер активные пользователи доминируют.

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Рисунок 1. (Слева) Суммарное число оценок(серым) и доля этих оценок (красным) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки. (справа) распределение числа оценок и среднее число оценок (зеленым) в зависимости от типа активности аккаунта: от 1 до 4 оценок/сутки, от 5 до 10 оценок/сутки, от 11 до 20 оценок/сутки, от 21 до 50 оценок/сутки и свыше 50 оценок в сутки.


Критические моменты:

  • Первые 30–60 минут определяют судьбу поста. В этот период супер активные пользователи успевают "задать тон", пока обычные пользователи ещё не проявили активность.

  • Их оценки могут либо резко поднять пост в топ, либо похоронить его. Более того даже простое игнорирование нового поста этими пользователями теоретически может разительно сместить баланс голосов для свежих постов в пользу иных в рамках их интересов. Ведь игнорирование постов (отсутствие оценок) снижает шансы поста на ранний старт в горячее,

  • Супер активные пользователи продвигают контент, соответствующий их предпочтениям, что может не совпадать с интересами большинства.

Что же можно сделать?

Чтобы сделать ленту "горячее" более сбалансированной и отражающей интересы большинства, нужно снизить влияние супер активных пользователей, сохранив их вклад, и дать шанс менее активным пользователям влиять на систему. Вот несколько стратегий:

  1. Первая идея заключается в том, чтобы ограничить влияние отдельных пользователей, нормализуя их вклад в зависимости от активности, например, введя весовой коэффициент для каждой оценки, обратно пропорциональный количеству оценок пользователя за сутки.

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Например, если пользователь ставит 5 оценок, его вес ~1; если 100 оценок — вес падает до ~0.2–0.5.

При этом можно периодически пересчитывать веса динамически (например, раз в час). Таким образом суперпользователи сохранят влияние, но их "голос" станет менее доминирующим.

2. Сделать рейтинг поста менее зависимым от мгновенной активности пользователей и более устойчивым к долгосрочным трендам, Используя формулу активности с временным затуханием

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

В этом случае оценки супер активных пользователей в первые минуты теряют вес со временем, если пост не получает поддержки от других. Посты с постепенным ростом (от большинства) получают преимущество.Оценки от менее активных пользователей получают больший вес, что выравнивает баланс

3. Можно разделить влияние супер активных пользователей и большинства через разные подходы к ранжированию. Например, можно сделать несколько скрытных "слоев" в ленте "горячее". В случае двух слоев получится "Глобальный топ" — который учитывает оценки всех пользователей с нормализацией и слой "тренды большинства" — который учитывает только пользователей с низкой и средней активностью (например, до 10 оценок в сутки).

Далее, показываем пользователям смешанную ленту (например, 70% "тренды большинства", 30% "глобальный топ").

4. Можно стимулировать активность обычных пользователей. Идея заключается в том, чтобы мотивировать менее активных пользователей ставить больше оценок, чтобы их вклад вырос, путем награды за оценки, например, дополнительный временный буст видимости своих постов постов, дополнительные стартовые плюсы при публикации поста.

5. Также можно мониторить и учитывать "бездействие" супер активных пользователей на конкретных постах.Если супер активный пользователь просматривает пост (например, проводит >3 секунд в зоне видимости) и не ставит оценку, это снижает рейтинг поста лишь на небольшую величину (например, -0.1 с учётом веса). Таким образом игнорирование становится менее разрушительным для постов, а активное продвижение их конкурентов теряет силу.

6. Можно использовать вспомогательные сигналы (время просмотра, скроллинг, клики) как индикатор интереса и включать их в рейтинг поста, особенно для менее активных пользователей. Создать "виртуальный лайк". Например, собираем такие данные как:

  • Время просмотра: сколько секунд пользователь провёл на посте (например, >5 секунд = интерес).

  • Глубина скроллинга: дошёл ли до конца текста/изображения.

  • Действия: клики на ссылки, увеличение изображения, копирование текста.

  • Т.о. метрика "внимания":

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Присваиваем "виртуальный лайк" за высокий уровень внимания (например, A>1.5 A > 1.5 A>1.5). Вес виртуального лайка можно сделать ниже явного (например, 0.3 вместо 1), чтобы не переоценивать пассивных пользователей.

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Такая система позволит дать "голос" большинству (~62–79% аудитории), которое редко ставит лайки/дизлайки. Т.о. посты, интересные пассивным пользователям, также получают шанс выйти в горячее, даже если супер активные их игнорируют. Снижается влияние "тишины" супер активных пользователей, так как рейтинг начинает зависеть от поведения большинства. А лента должна стать более репрезентативной для всей аудитории, а не только для активного меньшинства.

7. Интеграция машинного обучения для предсказания "интересности" контента. Идея заключается в том, чтобы использовать исторические данные, для того, чтобы модель предсказывала потенциальную популярность поста и корректировала его вес в реальном времени, помогая новым постам "взлететь" или компенсируя перекос от супер активных пользователей.

Фух, мы закончили! Спасибо за внимание!
Ребята, оцените: @kgam.tyhf, @Vseslogno, @CryptoBomj, @Relictor, @zoom100, @spawn652, @Lebedun, @PandaMedved, @Shoewreck, @Tulumbaec, @Mandalorian1984, @lelikness, @ShadowyIrbis.

Продолжение поста «Истинный пикабушник! Не 49.5, а все 50!!!» Пикабушники, 49 и 5, Рассказ, Статистика, Пикабу, Ответ на пост, Длиннопост

Подписывайтесь! Мы — супер авторский проект. Наши посты вызывают живой интерес, но порой балансируют на тонкой грани между плюсами и минусами. Нам действительно непросто конкурировать в горячем с вирусным, развлекательным контентом.

Просто почитайте или послушайте наши музыкальные повести! Всем добра!

Показать полностью 6
комментарии (14)
2
Автор поста оценил этот комментарий

Боты?

раскрыть ветку (1)
3
Автор поста оценил этот комментарий

Похоже, что нет.

Иллюстрация к комментарию
показать ответы
8
Автор поста оценил этот комментарий

Мне вообще кажется, что разгон поста идёт первые 10 минут (по крайней мере на 20-30-ых минутах уже можно достаточно точно спрогнозировать конечный рейтинг).

И тут очень важен фактор "рыцарей свежего". Именно оттуда и идут первые оценки.


Сегодня они обделены признанием и уважением со стороны админов (да даже и пользователи о них уже основательно подзабыли). А значит высока вероятность контрдействий: плюсование плохого контента и в лучшем случае игнор хорошего (конечно, выручают подписчики, но большинство из них с запозданием увидит пост). В периоды бунтов это хорошо было заметно.


Считаю, что возрождение данной инициативы - ключ к содержанию ресурса. Всё остальное - не менее важные, но второстепенные позиции.


То, что активная часть пикабушников и большая часть неактивных неравнодушна к ресурсу и желает более справедливой политики, интересного наполнения и готова приложить к этому руку - показало голосование за минусы, набрав рекордный рейтинг поста.

Поэтому, сейчас самое золотое время, чтобы развернуть Пикабу в лучшую сторону. Причем во многом это даже будет зависеть не только от администрации. Вспомните давно забытый тезис: "Пикабу - это пикабушники".


Так что стоит направить усилия не на войны с админами, а на культивирование хороших частных инициатив. Это сложно, согласен, так как особого желания уже никто не испытывает, доверия к сайту нет, мотивация на минимуме. Но кто знает, куда нас приведёт будущее. И И извините за крамольные мысли местами)

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Именно про разгонное время, выборку людей и потенциальную вероятность манипуляций в это время мы и пишем.

1
Автор поста оценил этот комментарий

А зачем? Так бы мы не знали своих героев...

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

10.3 Целенаправленно создаваемый вред. Администрация оставляет за собой право блокировки пользователей или части функционала профилей, которые осуществляют целенаправленные действия для препятствия корректному функционированию ресурса.
Пример: пользователи в сговоре размещают непотребный контент, пытаются накрутить ему рейтинг. Совместными усилиями в сговоре пытаются скрутить рейтинг контенту других пользователей.

Раз пользователь не заблокирован, счётчик работает, это указывает всем пользователям на то, что профиль активен и функционал его профиля не ограничен. Следовательно пользователь не нарушает правил пикабу, а следовательно 🤔

показать ответы
3
Автор поста оценил этот комментарий

Возможно ли что пикабу не учитывает их голоса? Возможно! Или нет?

#comment_242894369

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Ок. А что мешает остановить счётчик оценок? Почему он непрерывно изменяется и продолжает учитывать все новые + и -?

показать ответы
1
Автор поста оценил этот комментарий

Не понял немного Вашего вопроса. Какой счетчик оценок?

раскрыть ветку (1)
1
Автор поста оценил этот комментарий
Иллюстрация к комментарию
показать ответы
4
Автор поста оценил этот комментарий

делать минусы и плюсы не сложно, я когда-то бота писал, который сидел на виртуалке и мог ставить плюсы и минусы тысячами в сутки, по сути он только от скорости интернета зависел и времени прогрузки страницы

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Это понятно. Просто в данном случае они уже очень давно раздают огромное количество плюсов и минусов. Их не блокируют. Возможность оценивать посты не убирают. Но учитываются ли все эти оценки? Вот в чём вопрос.

2
Автор поста оценил этот комментарий

А представьте себе резкое ухудшение психологического состояния 5 тысяч активно минусящих пользователей, когда они узнают, что их минусы никуда не засчитывают?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Но такими действиями подрывается доверие к ресурсу у обычных пользователей. Ведь где тогда гарантия, что их плюсы и минусы учитываются так, как должно быть?

показать ответы
1
Автор поста оценил этот комментарий

Так счётчик поставленных им минусов крутится, но эти минусы не влияют ни на что =).

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Это не очевидно и нигде не прописано. Можно было бы отметку поставить (аля синяя галочка в телеге) у пользователя в профиле.

2
Автор поста оценил этот комментарий

Так нет же. Ограничение функционала в виде шедоу на оценки происходит не в счетчике оценок, поставленных пользователем, отражаемых в его профиле.

Ограничение происходит в записи оценок в поля плюсов и минусов, поставленных посту. Это совершенно разные таблицы данных.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Стороннему наблюдателю это не очевидно. Он видит профиль пользователя, который ему комент оставил.

показать ответы