Анализ распространения коронавирусной инфекции в мире

Поэксплуатирую и я тему коронавирусной инфекции.


1. Преамбула и допущения

Большое количество инсинуаций и море цифр, которые льются потоком со всех сторон, заставили меня приступить к самостоятельному анализу данных, которые находятся в открытых источниках. Мне всегда было интересно самому разобраться в происходящем, так что летом 2019 я был «экспертом по лесным пожарам», а сейчас переобулся в эксперта-вирусолога. Я не претендую на корректность своих расчетов и на то, что мои выводы, приведенные в конце статьи, истинные. Это всего лишь отражение моих собственных попыток провести небольшой анализ.


В статье я постараюсь сравнить статистику по заболеваемости в разных странах как в разрезе целых континентов, так и в разрезе отдельно взятых стран, а также постараюсь отыскать причины того или иного развития ситуации.


Проводя это исследование, я опирался только на данные, которые сообщает сама ВОЗ на своем официальном сайте с помощью ежедневных отчетов. К сожалению, отчеты организации публикуются не в формате csv, а в pdf, так что пришлось немного «поколдовать» с распознаванием таблиц и проверкой корректности распознанного текста. Кроме того, методика подсчета ВОЗ менялась время от времени (ниже по тексту будет видно, как именно), что дополнительно усложнило подсчеты.


Также надо учитывать, что я не обладаю профессиональными знаниями, не владею данными обо всех факторах, которые так или иначе влияют на распространение ситуации в мире и не могу физически охватить весь поток информации, я всего лишь человек с 2 глазами и 2 руками.

Вся статья – это плод моих аналитических измышлений, и я не призываю с ее помощью ни к каким действиям.


Покончив со вступлением, перейдем собственно к цифрам. Все графики делал на английском языке, просто потому что хочу, вот почему (на самом деле потому что отчеты ВОЗ на английском языке, в том числе и наименования стран).


2. Текущая ситуация

2.1. Общая ситуация с заболеванием в мире

Как видно из отчетов ВОЗ, в течение первого месяца (с конца января по конец февраля) болезнь концентрировалась внутри узкого круга стран, и наблюдалось определенное плато. Драматический всплеск и заражение других стран тотально начались в конце февраля, приобретя угрожающий размах в отношении всех регионов мира.

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

2.2. Болезнь, согласно отчетным данным, широко поразила страны с преимущественно городским населением. Чем ниже доля городского населения, тем меньше общее количество заболевших. Означает ли это, что страны с преобладающим сельским населением не страдают? На мой взгляд, нет: как правило, это бедные аграрные страны с низким уровнем ВВП, где нет оснований доверять качеству преподносимой в ВОЗ статистики. Сама организация на своем сайте указывает, что все данные фиксируются в соответствии с цифрами, предоставленными местными государственными источниками.

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост
Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Это хорошо заметно, например, на следующем графике, где на всю многомиллионную Африку зафиксировано ничтожно малое количество случаев.

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

(неподписанная полоса в правом графике — круизный лайнер Diamond Princess)


2.3. Ситуация в разрезе континентов

2.3.1. Азия

2.3.1.1. Общая информация

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Азия переживает сейчас нелегкое время за счет появления новых «центров заражения»: на верхнем правом графике видно, как случился спад после победы над инфекцией в Китае, сменившийся ростом, когда в гонку включились новые страны.


2.3.1.2. Основные пострадавшие страны.

Как сравнить между собой страны по эффективности применяемых мер, если болезнь везде начиналась в разное время, а страны отличаются по количеству населения?

Здесь и далее в качестве точки отсчета я взял дату подтверждения 100+ случаев и наложил на получившийся график общее количество подтвержденных случаев на 100 000 человек населения. В качестве примера, хорошо иллюстрирующего разный подход к инфекции в разных странах, я взял те государства, в которых на 16.04.2020 было подтверждено более 10 000 случаев: Израиль, Иран, Китай, Южную Корею и Индию.

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

На этом графике хорошо видно, что болезнь продолжает бушевать в Израиле без намека на замедление плеча прироста, несколько сглаживается ситуация в Иране и практически, можно сказать, побеждена в Китае и Корее. Индия вызывает у меня вопросы, и скорее это связано с крайне низким качеством подаваемой статистики. Какие-то внутренние убеждения заставляют меня сомневаться в истинности приведенных цифр.


На 6 день с даты появления 100+ случаев Китай применил жесткие карантинные меры, распространив их на всю страну. Это позволило купировать заражение и на десятый день с даты введения карантина количество новых больных перестало расти и практически сошло на нет к исходу 30 дней.


Совершенно другую ситуацию показывает Израиль: карантин был введен лишь на 24 день, и болезнь за это время успела поразить множество человек; ситуация усугубилась высокой скученностью проживания и большим потоком туристов. Все это повлекло за собой катастрофическое количество новых больных относительно сравнительно небольшого населения страны в целом.


Закрытие Ирана на 30 день способствовало сокращению количества новых заражений, начиная с 34 дня. Верить ли этим цифрам, учитывая, что Иран неоднократно обвиняли в сокрытии данных и умалчивании истинных масштабов катастрофы?


Корея не вводила жестких карантинных мер, исповедуя практику тотального тестирования и вылавливания больных, пока они не успели распространить инфекцию. Такой подход показал свою эффективность: после пика на 10 день количество новых случаев неуклонно сокращалось, практически сойдя на нет к настоящему времени.


Вывод: ранний жесткий карантин так же эффективен с точки зрения борьбы с болезнью, как и повальное тестирование.


2.3.2. Европа

2.3.2.1. Общая информация

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

На графиках видно, что появление новых случаев заражения в Европе в целом замедлилось и вышло на плато (верхний правый график), так же, как и случаи новых смертей (нижний правый график). Плато по появлению новых больных обусловлено лишь одновременным влиянием двух разнонаправленных факторов – сокращением случаев в Италии и Испании и появлением новых «центров заражения», таких как Великобритания и Россия.


2.3.2.2. Основные пострадавшие страны

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

В качестве основных пострадавших стран я выбрал те, в которых подтверждено более 50 000 случаев заболевания и дополнительно наложил данные по России. В общем и целом видно, что ситуация начинает выправляться в Германии, Италии и Испании и начинает приобретать угрожающий размах в Великобритании и России.


Количество новых случаев заражения на 100 000 человек населения сократилось практически втрое в Испании, вдвое – в Италии и показывает тенденцию к снижению в Германии. При этом видно, что все страны сравнительно поздно запустили карантинные механизмы – на 15, 19 и 21 дни. На этом фоне очень выигрышно смотрится Россия, объявив режим добровольной самоизоляции на седьмой день с даты выявления сотого случая заболевания.


Испании и Италии потребовалось приблизительно 15 дней, чтобы переломить ход болезни с даты старта карантина. Стоит ли ожидать подобного исхода в России? Нет, так как на момент написания настоящей статьи с даты объявления «карантина» прошло уже более 20 дней, а кривая прироста ползет неуклонно вверх. Тем не менее, Россия имеет в разы меньшее количество случаев заболевания: на 29-й день у нас было 2,36 случаев заболевания против 13,68 в Испании и 5,67 в Германии.


На фоне больших цифр как-то теряются малые страны, которые «незаслуженно» обходят стороной. Вот, например, статистика по заболеваемости в Ирландии, где ситуация выглядит в разы драматичнее, чем в той же Италии. Страна с населением чуть меньше 5 млн человек имеет прирост количества больных более 1000 человек в сутки:

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Вывод: ранний карантин по-прежнему показывает свою эффективность.


2.3.3. Северная Америка

2.3.3.1. Общая информация

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Как и в Европе, Северная Америка показывает ровное плато по общему количеству новых случаев и смертей. Небольшое снижение в конце графика обусловлено вкладом Соединенных Штатов, где c пиковых значений в ~30,000 в сутки количество заражений снизилось до 25,000 15 и 16 апреля (UPD: кривая по итогам 18 апреля снова пошла вверх, преодолев предыдущие пиковые значения).


2.3.3.2. Наиболее пострадавшие страны

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

В качестве наиболее пострадавших выступают страны с более чем 1000 случаев заболевания: США, Панама, Канада и Доминикана.

Позитива не видно нигде.


Я хотел наложить на графики еще другие ключевые события, типа проведение массовых мероприятий или интервью президентов, но, каюсь, сил уже не хватило.


Логика раннего карантина в случае северной Америки сломалась, т.к. Канада, которая объявила об изоляции граждан еще до появления 100 больного, тем не менее не показывает тенденцию по сокращению новых случаев даже на исходе третьего десятка режима карантина, а в Панаме и того хуже – ситуация начала выходить из-под контроля.


Отдельно необходимо сказать о США: карантинные мероприятия объявлялись разными штатами в разное время, а общенациональный режим был объявлен на 10-й день, когда в Штатах появилось 0,08 больных на 100 000 человек. Тем не менее количество заражений продолжает неуклонно расти и по сей день.


2.3.4. Южная Америка

2.3.4.1. Общая информация

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

То, что происходит в Южной Америке и Африке (см ниже) я адекватно объяснить не смог: очень резкие всплески заболеваемости в конце графика наряду с сильной волатильностью по количеству смертей. Вижу единственную причину, которая могла поспособствовать таким «скачкам цифр» — кривые статистические данные.


2.3.4.2. Наиболее пострадавшие страны

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Может сложиться впечатление, что драматичнее всего ситуация развивается в Эквадоре и Перу – странах, которые объявили карантин практически на самом старте с момента выявления 100 инфицированного случая. Думаю, что карантинные мероприятия пока не приводят к должному результату по причине низкой дисциплинированности жителей и низкого уровня жизни. Кроме того, сохраняется множество вопросов по корректности статистики при виде резких всплесков в этих странах.


2.3.5. Африка

2.3.5.1. Общая информация

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Как я уже писал выше, вызывает много вопросов качество предоставляемых данных. В частности, сомневаюсь в корректности данных по Алжиру:

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

4 и 6 апреля зафиксировано 0 смертей, тогда как в соседних датах – резкие всплески. Как по мне, это лишь позднее предоставление данных по смертям предыдущих дней.


2.3.5.2. Наиболее пострадавшие страны

Анализ распространения коронавирусной инфекции в мире Коронавирус, Пандемия, Аналитика, График, Текст, Длиннопост

Уже очень многие заметили, что страны с наибольшим количеством выявленных заболеваний сконцентрированы на крайнем севере и крайнем юге континента – это Алжир, Египет, Марокко и ЮАР. При этом они по стечению обстоятельств являются странами, которые проводят больше всего тестов. Очевидно, что инфекция не могла пройти стороной остальные страны, и с большой вероятностью уже бурлит внутри границ бедных государств и в обозримом будущем жителям африканского континента может угрожать катастрофа, обусловленная крайне низким уровнем жизни и антисанитарией. В любом случае пока еще мало данных, чтобы можно было однозначно утверждать.


3. Выводы

3.1. Считаю, преподносимая нам катастрофа в странах богатого запада является навязанной нам иллюзией, подкрепленной более ответственным подходом этих стран к предоставлению данных в ВОЗ. Что происходит в бедных странах с преимущественно сельским молодым населением — пока остается только гадать.

3.2. Ранний карантин способствует более «легкому» прохождению кризиса.

3.3. Наши власти (ох, сейчас меня заминусуют) – молодцы, объявив режим изоляции как можно раньше. Остается надеяться на дисциплину граждан, чтобы сгладить плечо новых случаев заражения.


4. Использованные источники

• Population data: population.un.org/wpp/Download/Standard/Population

• GDP data: unstats.un.org/unsd/snaama/Downloads

• List of countries and continents: datahub.io/JohnSnowLabs/country-and-continent-codes-l...

• Urban population rate: data.worldbank.org/indicator/sp.urb.totl.in.zs


5. Затраченное время

5 часов на распознавание данных из отчетов ВОЗ

3 часа на форматирование таблицы xls

5 часов на подготовку графиков и поиск закономерностей

3 часа на поиск информации о датах старта карантина


Что ж, надеюсь, я смог понятно рассказать о том, что происходит с инфекцией. Спасибо за внимание :)