Бесполезная статистика Пикабу

Минутка случайной никому не нужной статистики. Часто видно в постах и комментариях неправильное написание частицы "-нибудь". Например, "кто нибудь", "когда нибудь" и тд. Чисто для удовлетворения интереса подсчитаем какой процент постов и комментов содержит неправильное написание, а какой правильное. И, в частности, интересно как это соотношение менялось с годами тут на Пикабу.

Всего в подсчете статистики было проверено 336,065,214 документов (посты + комменты), с самого первого дня Пикабу и до текущего. Посты и комменты в открытом доступе, поэтому откуда у меня инфа думаю не стоит задавать вопрос.

Соотношение в процентах выглядит вот так:

Бесполезная статистика Пикабу Статистика, Пикабу, Дефис, Грамотность

Процент правильного написания (синий) и неправильного (красный)

А в абсолютных цифрах (кол-во постов + комментов) вот так (без первых 4 лет, так как там мало документов и график не строится нормально).

Бесполезная статистика Пикабу Статистика, Пикабу, Дефис, Грамотность

Кол-во правильного написания (синий) и неправильного (красный)

Если смотреть процент, то он почти не меняется с годами. Ожидал другое увидеть, но и такое понравилось. Интерес удовлетворен, делюсь с вами.

Правила сообщества

Лига занимается странными веселыми подсчетами на основании уже имеющихся в общем информационном доступе знаний. Расчеты - ради лулзов и хорошего настроения. Не нудите сами и не занудничайте в адрес других, играть в Шелдона Купера хорошо до определенного предела.

1
Автор поста оценил этот комментарий
Спасибо, но статистика может быть неверной, так как не учитывает "будь или нибудь" ))
раскрыть ветку (1)
7
Автор поста оценил этот комментарий

да, тут с погрешностью статистика однозначно. Но ваш вариант тоже является ошибкой, так что если его кто-то писал, то все норм, он засчитается в красные линии. Правильно писать же "будь или не будь"

показать ответы
7
Автор поста оценил этот комментарий

Необходима. Нет не так.. НЕОБХОДИМА такая же статистика по -тся, -ться 🤣

раскрыть ветку (1)
7
Автор поста оценил этот комментарий

ться/тся сложно искать. Там уже не тупым поиском, а нужно анализировать контекст. Например,

- он просится

- проситься могут все


Такой умный поиск быстро не сделать

показать ответы
Автор поста оценил этот комментарий

Да свайп часто глючит, нет к нему доверия, а переходить в символы долго на телефоне. Мне и запятые часто лень ставить если вторая рука греется где-то в трусишках под подбородком

раскрыть ветку (1)
3
Автор поста оценил этот комментарий

имхо. Так как в сети ты обычный комментатор, ни больше и ни меньше, то чтобы твой коммент воспринимали изначально непредвзято нужно стараться писать все грамотно. Само собой ошибки всюду, просто есть грубые ошибки, если легкие, рядовые. Когда комментатор пишет с грубыми ошибками текст, то при чтении его возникают мысли: "это ребенок?", "он вообще школу заканчивал?", "это вообще русский человек?" и тд.


Комменты и посты - это способ коммуникации. Поэтому неважно где вторая рука, важно все же стараться писать правильно на всех устройствах.

показать ответы
5
Автор поста оценил этот комментарий

А теперь давай про "чтобы" и "что бы")

раскрыть ветку (1)
6
Автор поста оценил этот комментарий

но и так и так правильно же, зависит от контекста

показать ответы
3
Автор поста оценил этот комментарий

Я думаю смысл есть. Сам всегда сижу с мобильного хрома на андроид смартфоне. У меня гугл клавиатура и на мой взгляд она очень классно исправляет написание, я часто пишу «ктонибудь» телефон сам исправляет как надо (вообще часто пишу не правильно, а быстро, потому что либо телефон исправит сразу, либо предложит вариант написания). Возможно многие пишут не правильно не всегда от неграмотности.

раскрыть ветку (1)
5
Автор поста оценил этот комментарий

Отдельно проверять по версия устройств смысла нет, так как статистика примерно одинаковая ещё с тех времен, когда с мобильника Пикабу пользовались единицы пользователей.

Даже если добавить в статистику информацию с какого устройства, то что это меняет? Ну узнаем мы долю тех, кто пишет "кто нибудь" с мобильника, это же ничего не меняет, ошибка есть. То что она является следствием неудобности ввода текста не меняет тот факт, что это ошибка написания слова. Данный пост со статистикой показывает соотношение правильного и неправильного написания, амнистий тут нет для тех, кто не может на мобильной клавиатуре вводить дефисы.

29
Автор поста оценил этот комментарий

А вы не пытались проследить зависимость наличия/отсутствия дефиса от типа устройства, с которого подопытный пишет на Пикабу?

раскрыть ветку (1)
6
Автор поста оценил этот комментарий

это особо смысла не имеет. Посмотрите на график, в 2013 году было 25% неправильного написания и затем все остальные года примерно столько же. Мобильная версия Пикабу появилась примерно в 2016 году, а первые приложения под Android и iOS и того позже. Так что в 2013 думаю почти не было тут мобильных пользователей.

показать ответы
Автор поста оценил этот комментарий

Нужны технические подробности. Как получал данные?

раскрыть ветку (1)
4
Автор поста оценил этот комментарий

как уже в самом посте написал - данные все в открытом доступе и на пикабу нет никакого хэша/шифра в url постов, что позволяет использовать IDOR. Т.е. вопрос только как я прошелся по всем этим данным. Тут либо где-то уже собранную БД использовать, либо самому её создавать с нуля. Что именно я использовал все же пусть останется секретом, не хотел бы эту информацию выкладывать.

А сами цифры считал так: поиск документов с вхождением слова "-нибудь" и " нибудь" регистронезависимо. Погрешность в подсчете конечно будет, так как кто-нибудь точно писал вот так "кто - нибудь", но будем считать это написание неправильным (собственно оно так и есть)

Автор поста оценил этот комментарий
Где запятые?
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

в некоторых местах отсутствуют. Про пунктуационные ошибки вообще можно тему не заводить. Это проблема 99.(9)% людей в сети. Но все же есть разница упустить запятые для отделения вводного слова, или тупо не ставить запятые нигде и тогда текст сложно читать и понимать. Да и пунктуация все же не так бросается в глаза, как проблемы орфографии или грамматики. В первую очередь, конечно, орфографии

показать ответы
Автор поста оценил этот комментарий

Господи, ну ты чего? Да просто лень тыкать лишний раз на тире/ дефиз, на запятые и прочие знаки окромя букв.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

ну, кому-то лень, а кто-то не знает правила. И то и другое выглядит одинаково в итоге

показать ответы
Автор поста оценил этот комментарий
Но впм безразлично, как ваши каменты воспнинимают, верно?
раскрыть ветку (1)
Автор поста оценил этот комментарий

нет, мне не безразлично . К чему вы клоните, не тяните?

показать ответы
Автор поста оценил этот комментарий

Какая была скорость парсинга и сколько всего гигов обработано? Сайт не ругался?

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

про способ получение данных, увы, рассказывать не буду. Но скажу так - Пикабу парсить сложно и опасно, могут забанить. Пикабу защищен DDOS Guard, поэтому если идет аномальный трафик, то срабатывают фильтры защиты.

1
Автор поста оценил этот комментарий
Да ладно! Никто никому ничего не должен. Не научные статьи пишем
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

ну, тут ваше дело как ваши комментарии будут восприниматься. Если вам безразлично, то пишите как вам удобно) Но думаю большинству людей (и статистика это подтверждает) не безразлично как их комменты воспринимают, поэтому они стараются писать грамотно

показать ответы
1
Автор поста оценил этот комментарий

В основном источник ошибок - это использование смартфона

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

как я уже в другой ветке ответил - у Пикабу мобильная версия сайта появилась примерно в 2016 году. А статистика примерно одинаковая начиная с 2010 года. Доля мобильный пользователей активно росла с годами, но как видно по графику, что соотношение примерно одинаковое за все года. Это означает, что вовсе дело не в устройстве ввода текста

показать ответы
Автор поста оценил этот комментарий
Ну, к тому, что людям, которые игнорят правильное написание текста, может быть тоже небезразлично, но лениво исправлять. Мне вот тоже небезразлично, как я пишу, у меня и автозамены всякие отключены, чтобы сохранять навык, но я не буду возвращаться в произвольное место текста, чтобы исправить опечатку или ошибку, если мне безразлично мнение адресата. Если выделить в вашей статистике отдельно непреднамеренную и "безразличную" безграмотность, то показатели прироста/убыли грамотных текстов будут иначе выглядеть. Стало больше похуистов или жертв образования.
раскрыть ветку (1)
Автор поста оценил этот комментарий

то показатели прироста/убыли грамотных текстов будут иначе выглядеть

Это лишь повлияет на количество текстов с ошибкой, но не повлияет на динамику изменения соотношения по годам. Т.е. если убрать какую-то долю текстов, где непреднамеренная ошибка, то эту долю мы удаляем из соотношения для каждого года, тем самым динамика не меняется. Поменяются просто проценты правильных и неправильных текстов, но поменяется одинаково во всех годах. Иными словами существенно ничего не поменяется.


Я тоже часто забиваю болт, когда вижу в своем тексте несущественную ошибку/опечатку где-то там и возвращаться править лень. Но я это делаю при общении со знакомыми людьми, по работе, с друзьями. Если же речь про общение с незнакомыми людьми, то стараюсь по мере возможности не допускать ошибок. При этом я троечник был в школе по русскому языку, ещё в добавок я не из России, и школу почти 20 лет назад окончил, и за всю жизнь я из книг только Гарри Поттера читал, но все равно стараюсь правильно писать насколько могу. И приятно, когда в общении со мной собеседник тоже старается ;)

показать ответы
Автор поста оценил этот комментарий

@SupportTech, можете подтвердить слова исследователя? Спасибо

раскрыть ветку (1)
Автор поста оценил этот комментарий

подтверждать что, статистику или коммент выше? Если про мобильную версию сомнения, то вот пост админа Мобильная версия Пикабу , он был правда в 2015 году, чутка промахнулся с годом.

показать ответы