Уровень смертности от COVID-19
Несколько раз натыкался на обсасывание темы про уровень смертности от Коронавируса и мне не очень нравится, то, что я видел. Ангажированно, упрощенно, немного истерично. Очень редко что-нибудь стоящее и свободное от конспирологических теорий.
Я не специалист в медицине и социологии, но достаточно неплохо понимаю статистику (по крайней мере изучал ее детально 18 лет назад).
На мой взгляд, невозможно абсолютно объективно оценить смертность именно от Коронавируса даже теоретически (вот люди, которые погибли в пожаре в больнице, в которой они находились из-за Коронавируса - это от Коронавируса или от пожара? И если от пожара, то ведь они не оказались бы в больнице без Коронавируса?). Но можно оценить уровень смертности общий по стране. Вот, например, сайт https://www.euromomo.eu/ - беспристрастно показывает уровень смертности. Понедельно, по странам (правда, только по некоторым европейским странам, но хоть что-то), по возрастным группам. Наглядно видно, что в Австрии или Венгрии, например, никакого значимого эффекта Коронавирус не произвел, в Швеции или Швейцарии - существенный эффект, а вот в Испании и Англии - просто катастрофа, показатель z-score уходит за 30-40.
Сначала я подумал, что показатель z-score излишне добавлен на этом сайте, все-таки для 99% людей это незнакомый показатель, который может запутать и т.д. и т.п.
Но затем я увидел сразу несколько статей про смертность в Москве (и, по-моему, в Питере) за апрель и про то, что "власти нас обманывают", а также про то, что "американцы все врут" и понял, что без этого показателя сложно объяснить то, что происходит.
Что такое z-score - это величина, показывающая на сколько среднеквадратичных отклонений текущий показатель отличается от среднего значения. Что такое среднеквадратичное отклонение - это величина, показывающая насколько в среднем значения временного ряда отличаются от среднего значения этого временного ряда. Звучит не очень просто, но на примере все будет наглядно.
Возьмем два ряда - один ряд будет 25, 75, 25, 75, 25, 75..., а другой ряд будет 0, 100, 0, 100, 0, 100...
Среднее значние у них одинаково (это 50). Среднеквадратичное будет 25 для первого и 50 для второго.
Если теперь мы увидим что следующее число в последовательности оказалось равным 125, то для первого ряда z-score будет 3 (=(125-50)/25), а для второго 1.5 (=(125-50)/50). Другими словами, если мы увидим в первой последовательности 125 мы удивимся гораздо сильнее, чем если мы увидим 125 во второй последователльности.
Возвращаемся к смертности и конспирологиям. Я взял данные по смертности по МОскве за последние 10 лет.
Видно, что плохим выдалось лето 2010 (видимо, пожары и жара).И обычно выделяется декабрь-январь и иногда март. Не знаю почему, видимо какие-то медицинские факторы.
Так или иначе, если убрать лето 2010 как "специальное событие", среднеквадратичное отклонение для смертности в Москве за последние годы = 665, а средняя смертность в месяц = 9905. Значение за апрель - 11846 смертей (что, конечно, очень плохо само по себе), уровень z-score 2.92. При этом напрямую эти данные сравнивать с данными из EuroMOMO нельзя, так как там идет речь о недельных данных, а в этом случае - о месячных, они более гладкие.
Что это значит? Это значит, что люди действительно стали умирать больше в Москве в апреле, и это очень печально. В то же время нельзя просто заявить, что в этом апреле умерло на 2000 человек больше, чем обычно (как можно было бы сказать, глядя только на среднее значение и на значение в апреле), поскольку c вероятностью 68% может случится любое число 9905 плюс-минус 665 , с вероятностью 95% может случится 9905 плюс-минус 2*665 и т.п. Величина 2.92 достаточно большая, и без Коронавируса, конечно, умерло бы меньше людей, но говорить, что официальные данные по смертности от Коронавируса занижены/завышены - не честно.
Спасибо!