58

Графики по коронавирусу, часть 4. Fitting в Origin

Уверен, что эта тема с вирусом приелась на Pikabu  - третий пост даже не вышел в горячее, но появившиеся подписчики, очевидно, ждут новых графиков. Держите! Сегодня я наконец сделал анализ в Origin.


Сначала обычные картинки Excel:

Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост
Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост

Для интервала 27 января - 3 февраля, я решил построить смертность - отношение числа погибших от вируса к сумме погибших и выздоровевших. Эта функция падает. Либо стали лучше лечить, либо среди первых заболевших было много слабых здоровьем людей:

Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост

Теперь про заражения:

Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост
Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост

Тут до меня начало доходить, что экспоненциальным ростом и не пахнет. Что, если построить тот же график, но в абсолютных единицах?

Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост

Да это же линейная зависимость! (Производной). А если производная растет линейно - значит мы дифференцируем x^2. Я загнал данные по заражениям в Origin, и сделал polynomial (2) fit:

y = Intercept + B1*x^1 + B2*x^2

Где x - это дата, y - это число зараженных.

Результат:

Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост

Черные точки - реальные данные. Красная линия - модель. По оси Y число зараженных. Да, я сделал график до 34ого января, потому что утро и мне лень разбираться с датами или редактировать скриншот) На самом деле 34е января это 3е февраля.

Графики по коронавирусу, часть 4. Fitting в Origin Коронавирус, Microsoft Excel, Origin, Длиннопост

Для главного (B2) коэффициента ошибка всего 3%, а скорректированный коэффициент детерминации (R square) целых 0.999! Мне кажется, аппроксимация прошла идеально. Но как инженер, я не понимаю, почему эта функция (число зараженных от времени) оказалась параболой (логична же экспонента). Скорее всего, это временный эффект в преддверии переломного момента, когда прирост заражений, измеряемый людьми, начнет падать. График той же атипичной пневмонии тоже был похож на экспоненту и параболу, пока не превратился в сигмоиду.


Всем спасибо за внимание!