Датасет Пикабу
Времени фиксить pikastat нет(да и, честно говоря, есть идеи проектов по-интереснее), поэтому выкладываю базу в паблик, чтоб люди могли пособирать интересную статистику и по-обучать интересные модели машинного обучения. Если кто обучит GPT-2/3, вообще цены не будет(я хотел сам, но ниасилил).
Качать тут -> https://pikastat.d3d.info/
Заливать в постгрес
Внутри 2'999'610 пользователей, 6'907'622 постов, 153'708'150 комментариев, всякие штуки типа сообществ и прочего, а также история всех полей с определённого момента.
Если вдруг непонятно, какие столбцы за что отвечают, пишите, объясню)