Vladimir98

Vladimir98

пикабушник
56К рейтинг 916 подписчиков 3371 комментарий 124 поста 46 в горячем
2 награды
номинант «Книжный пост года – 2018» 5 лет на Пикабу
136

Магия против науки — сравнение книг о Гарри Поттере и диссертаций

Продолжаем анализировать русский язык при помощи математики! Предыдущие посты:

1. Частота букв в русском языке

2. Лев Толстой против Пикабу — статистика русского языка


В комментариях под прошлым постом предложили сравнить очень интересный материал — магистерскую и докторскую диссертации, написанные на одной кафедре. Этим мы сегодня и займёмся! А чтобы читать пост было интересно всем, сравним их с первой и последней книгами из серии о Гарри Поттере


Волшебник из книг Джоан Роулинг рос вместе с нами. Первая книга «Гарри Поттер и философский камень» написана простым языком, понятным и детям. В последней книге серии — «Гарри Поттер и дары смерти» герои взрослее, а проблемы серьёзнее

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

В науке исследования, как правило, ведутся в узком направлении. Но каждая работа должна быть уникальной, а магистерская и докторская диссертации отличаются по сложности. Итак, что по вашему мнению будет больше похоже: первая и последняя книги о Гарри Поттере или магистерская и докторская диссертации, написанные на одной кафедре? Ставки приняты, начнём анализ!


Тексты о волшебстве

Начнём с анализа книг о Гарри Поттере. Сперва, по традиции, посмотрим на топ 15 самых частых слов в книгах:

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост
Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

Да уж, нет никаких сомнений в том, кто главный герой серии. Забавно, что Гермиона обогнала Рона по частоте упоминаний в последней книге, хотя в первой уступала даже Хагриду. А ещё в серии неожиданно часто встречаются руки


Кстати, в этот раз я улучшил предобработку: теперь стоп-слова, наподобие частиц и предлогов, выбрасываются из текста, а остальные слова приводятся к одинаковой форме. Например, и «ответил», и «ответила» превращаются в «ответить», а «Рона», «Рону» и «Рон» считаются как одно слово. Это называется лемматизацией


Это делается автоматически и иногда приводит к казусам. Например «Малфой» превратился в слово «Малфа», а «Снегг» в «Снегга». Любители фанфиков, наверняка, останутся довольны


Вот визуализация топ 150 слов в текстах. Чем больше слово, тем чаще оно упоминается в книге:

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост
Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

В первой книге очень много имён, ведь она знакомит нас с новым миром. В последней речь больше идёт о главных героях и их действиях


Тексты о науке

Для анализа использовались две работы с кафедры электротехнологий, электрооборудования и автоматизированных производств Чувашского Государственного Университета. Большое спасибо за этот материал Фёдору Иванову (@fedor0804)


1. Магистерская диссертация «Индукционная установка для сквозного нагрева заготовок» Фёдора Иванова

2. Докторская диссертация «Исследование особенностей характеристик электротехнологических дуг в дуговых печах» Дениса Михадарова


Топ слов, конечно, совсем не похож на книги о Гарри Поттере. Главные герои здесь индуктор и дуга, а в тексте часто встречаются числа и специальные символы. Их, к сожалению, не удалось правильно обработать и на графиках они выглядят как прямоугольники. Скорее всего, это греческие буквы, например, β

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост
Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

Сравнение магии и науки


Итак, у нас есть 4 огромных текста. Как понять, насколько они похожи друг на друга? Для этого можно посчитать косинус угла между текстами или даже сам угол. Давайте разберёмся, как это работает


Представим два текста поменьше: по одному предложению в каждом. Первый текст — «Еле-еле ели». Второй текст совсем лаконичный — из одного слова «Едим». После лемматизации у нас будут уже такие тексты:

1. еле еле есть

2. есть


Теперь подсчитаем количество слов в них:

1. «еле»: 2, «есть»: 1

2. «еле»: 0, «есть»: 1


Мы можем нарисовать простой график, где по одной оси будет отложено количество слова «еле» в тексте, а по другой — количество слова «есть». Изобразим наши предложения на этом графике

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

Теперь не проблема посчитать угол между текстами! Можно, конечно, взять транспортир. Но для того, чтобы решить эту задачу для текстов с тысячами слов, это не поможет. Если конечно, вы не живёте в тысячемерном мире и у вас полно тысячемерных транспортиров


Мы представили тексты в виде векторов. В школе вы считали скалярное произведение между векторами и находили через него угол. Здесь можно сделать то же самое — и неважно, сколько всего уникальных слов в текстах – два или тысячи. Для текстов из примера — косинус будет равен примерно 0.44, а угол — 63 градуса


Чем меньше угол между текстами, тем больше они похожи. Если же угол равен 90 градусам, то тексты перпендикулярны — совсем разные. Например, такой угол был бы между текстами на русском и китайском языках — у них нет общих слов. Надеюсь, вы только что стали немного умнее :)

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

Вернёмся к нашим текстам. Больше всего оказались похожи книги о Гарри Поттере. Угол между ними — всего 26 градусов

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

Между магистерской диссертацией и книгами о Гарри Поттере оба угла составили 87 градусов. Эти тексты очень разные. Ещё менее похожими на книги Джоан Роулинг оказалась докторская диссертация — у неё получился угол 88 градусов с первой книгой и 89 градусов с седьмой


Что забавно, научные работы тоже оказались довольно разными. Угол между диссертациями — целый 71 градус


Так что, последняя книга о Мальчике, который выжил — почти то же самое, что и первая, но немного под другим углом. А читая научные работы, даже с одной кафедры, вы каждый раз изучаете новый труд

Магия против науки — сравнение книг о Гарри Поттере и диссертаций Наука, Научпоп, Статистика, Гарри Поттер, Русский язык, Лингвистика, Инфографика, Математика, Человек наук, Длиннопост

Заглядывайте в комментарии – там есть небольшой бонус. Пишите, анализ, каких текстов вам ещё бы хотелось увидеть


Моя группа ВК и телеграм-канал

Показать полностью 10
1909

Лев Толстой против Пикабу — статистика русского языка

Недавно я делал пост о частоте букв в русском языке. Из него вы узнали, что «О» встречается чаще, чем 14 самых редких букв вместе взятые, 50% языка написана всего 7 буквами, а «Ё» пора переносить из букваря в Красную книгу

Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост

Сегодня мы пойдём ещё дальше! Проанализируем не только буквы, но также их сочетания и целые слова. Для анализа возьмём 4 тома произведения «Война и мир» одного небезызвестного Льва. А для того, чтобы понять, насколько достояние культуры похоже на современный русский язык, сравним его с одним из самых популярных постов на Пикабу 2020 года. У него достаточно много комментариев, в которых люди говорят на разнообразные темы. Это отлично подходит для анализа языка. Вот содержание поста:

Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост

Кажется, что язык в комментариях под такой картинкой будет совсем не таким, как в художественном произведении 19 века. Но достаточно длинные тексты становятся похожими друг на друга и подчиняются общим закономерностям. Например, сравним частоты букв:

Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост

Они почти идентичны! Единственное, что явно выделяется — частота буквы «Т» в комментариях Пикабу. Предположу, что это связано с тем, что в посте обсуждают Билла Гейтса


Кстати, в комментариях получилось 83 тысячи слов, а в книге — 465 тысяч


Теперь посмотрим на статистику поинтереснее! И самое популярное слово… «И». «И» — самое популярное слово. В обоих текстах

Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост
Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост

«Топ 15» слов удивительно похожи! Настолько, что первые 4 слова полностью совпадают. Забавляют и суммарные количества слов. Читая «Войну и Мир», вам придётся больше 20 тысяч раз встретить слово «И». Предположим, что на его прочтение уходит одна десятая секунды. Тогда после завершения всех четырёх томов, вы суммарно потратите пол часа только на чтение слова «И»


Вы можете возразить, что эти слова необходимы для связывания текста, поэтому неудивительно, что они так часто встречаются. Можно удалить все предлоги, союзы, частицы и прочие «стоп-слова». Тогда тексты снова приобретают свою индивидуальность. По графику можно сказать, о чём в них шла речь и кто именно главный герой:

Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост
Лев Толстой против Пикабу — статистика русского языка Война и мир, Наука, Научпоп, Статистика, Инфографика, Русский язык, Визуализация, Человек наук, Длиннопост

Тогда в топ «Войны и мир» попадает 2 французских «стоп-слова» — «de» и «a», что тоже забавно. А у Пьера Безухова и князя Болконского идёт нешуточная борьба за первое место


Ещё правильнее было бы привести слова к одинаковой форме (например, считать «Пьера» и «Пьер» или «Деньги» и «Денег» как одно и то же слово). Могу сделать это в следующих постах :) Пишите, анализ каких текстов вам ещё хотелось бы увидеть или если у вас есть идеи для более интересного анализа


Моя группа ВК и телеграм-канал

Показать полностью 6
398

Самые цитируемые научные статьи

Работа учёного — производить знание, которого в мире раньше не было. Это знание упаковывают в удобную и компактную форму — научную статью. Другие учёные затем могут сослаться на неё в своих работах — это называется цитированием. Количество цитирований показывает, скольким людям пригодилось добытое вами знание. Это одна из основных метрик полезности научной статьи

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

Гора только из титульных листов всех научных статей была бы выше Килиманджаро


Конечно, количество цитирований не определяет качество работы. Она может быть сделана по очень узкой теме, которую сложно использовать большому количеству учёных. Среднее количество цитирований отличается и по научным областям — в медицине оно больше, а в математике — меньше. А есть и вообще откровенное читерство — изобрести метод, который позволит другим людям делать новые открытия. Такие статьи гарантированно будут хорошо цитироваться. Идеальный рецепт! Дело за малым — изобрести революционный метод…


Вот график топ-100 статей по цитируемости. Высота столбиков обозначает количество цитат, а цвет – научную область

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

Разберём рекордсменов — самые цитируемые статьи за всю историю. Как вы могли догадаться, они все связаны с биологией. И во всех изобретается новый метод


1. Измерение количества белка

У этой статьи с лаконичным названием «Protein measurement with the Folin phenol reagent» больше 300 тысяч цитирований! Её первый автор — американский биохимик Оливер Лоури. Статья была принята к публикации в 1951 году и с тех пор стала настоящим блокбастером. Метод, изложенный в ней известен каждому биохимику на планете


А ещё, в ней очаровательные иллюстрации, сделанные от руки. Вот так выглядели графики, когда не существовало даже экселя:

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

В чём открытие?

Лоури разработал метод для определения количества белка в растворе. Вкратце это выглядит так — вы добавляете к раствору некоторое химическое вещество и он меняет цвет. Чем больше в исследуемой жидкости белка, тем насыщеннее будет цвет раствора

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

Измерив насыщенность цвета с помощью специального прибора, вы сможете найти точку на графике, которая покажет, сколько белка было в растворе


Почему это важно?

Белки — это основа известной нам жизни. И людям очень интересно измерять, сколько их в разных жидкостях! На этом основаны медицинские тесты и множество других научных работ



2. Разделение белков по массе

Статья с чуть более громоздким названием «Cleavage of Structural Proteins during the Assembly of the Head of Bacteriophage T4» на момент написания этого поста процитирована 268668 раз! С момента выхода в печать в 1970 году это в среднем по 14 цитирований в день. Согласитесь, было бы приятно, если бы десяток человек каждый день вспоминал о вашей работе?


В чём открытие?

Швейцарский учёный Леммли усовершенствовал метод для разделения белков по заряду и молекулярной массе. Это позволило другим учёным отделять разные белковые молекулы друг от друга. Выглядит это примерно так. В отдельных тёмных полосках — разные молекулы

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

Почему это важно?

Как вы уже поняли, белки очень важны для биологии и медицины, и потому интересны учёным. Но белков очень много. Например, у человека их почти 30 тысяч. Даже у такого маленького организма, как фаг (вирус) кишечной палочки их 160. Исследовать сразу все почти невозможно. Было бы гораздо удобнее отделить белки друг от друга и изучать по отдельности. Это и позволяет сделать метод Леммли



3. Измерение количества… белка?

Почётная бронза пока что принадлежит работе с уж совсем длинным названием «A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding». В 2020 году у неё было 221523 цитирования. Забавно, но её тема точно такая же, как у золотого рекордсмена

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

В чём открытие?

Метод Лоури, как и все первопроходцы, имел свои недостатки и был слегка капризен к условиям. Американский учёный Брэдфорд разработал ещё более простой и быстрый метод для измерения количества белка, за что и получил заслуженное признание


Почему это важно?

Это вы уже и сами знаете ;)



4. Чтение ДНК

Чтобы не оставлять впечатление, как будто учёные занимаются только белками, добавим ещё одну статью. У неё чуть более скромное количество цитирований — «всего» 75 тысяч. Зато эта работа была отмечена Нобелевской премией по химии

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

Фредерик Сэнгер, автор работы


В чём открытие

ДНК — это инструкция по сборке живых организмов, которая записана в каждой живой клетке. Английский биохимик Фредерик Сэнгер разработал метод, который позволяет её читать


Почему это важно

ДНК хранит в себе невероятно много информации о каждом организме. История жизни на планете, механизм заболеваний, ключ к появлению новых лекарств — всё это можно найти в ДНК. Сэнгер открыл настоящую сокровищницу для учёных со всего мира! С тех пор появились и другие методы, решающие ту же задачу, но именно метод Сэнгера остаётся самым точным. Впервые геном человека был прочитан во многом благодаря ему

Самые цитируемые научные статьи Наука, Открытие, Ученые, Научпоп, Топ, Биология, Человек наук, Длиннопост

Кстати, позже, этот учёный получит и вторую Нобелевскую премию. Она будет присуждена за метод, который позволит читать, последовательность, как вы думаете, чего?.. Конечно, белков


Есть ещё много интересных статей, но пока остановимся на этом :)


Моя группа ВК и телеграм

Показать полностью 7
6934

График частоты букв в русском языке

График частоты букв в русском языке Статистика, Русский язык, Научпоп, График, Человек наук

На первом месте – "О", она встречается в русскоязычных текстах чаще, чем 14 самых редких букв в сумме! Самая распространённая согласная – "Н", что для меня было неожиданно. А мягкий знак далеко не такой редкий, как я думал – он встречается чаще, чем целых 15 букв


На последнем месте грустит "Ё". Её нещадно вытесняет из письменности "Е", чтобы удержать своё второе место


Если вы читаете достаточно длинный текст, то его 50% составляют всего 7 букв!


Мой телеграм-канал
44

Breakthrough Prize — "Оскар" мира науки

Наверняка вы слышали про Нобелевскую премию. Но не удивлюсь, если вы никогда не смотрели церемонию награждения — она довольно скучная. Может быть даже скучнее, чем бубнеж одного конкретного лектора по физиологии на втором курсе


Наверное, так и подумал Юрий Мильнер, основатель Mail.ru Group и владелец инвестиционной компании DST Global. В прошлом — физик-теоретик МГУ


Вместе с женой Юлией в 2012 году они учредили приз за прорывные достижения в области фундаментальной физики и выплатили девяти учёным награду в 3 000 000$ каждому


В 2013 Миллеры позвали своих друзей – Марка Цукерберга и Присциллу Чан, Сергея Брина и Энн Воджицки, Джека Ма и Пони Ма. И как забабахали призовой фонд в 33 миллиона долларов (совершенно обычная история, мы с друзьями так каждую субботу развлекаемся)


Так родился Breakthrough Prize, и вот почему это круче чем Нобелевка:

• Он присуждается за значительные достижения в области фундаментальной физики, медицины и биологии, а также математики.

• Непосредственно каждый победитель получает 3 000 000$, а те, кто был номинирован и попал в шорт-лист получают премию Новые Горизонты в <вставить область науки> размером в 100 000$. Кстати, основной приз в 2 раза больше размера Нобелевской премии, но кто считает…

• Победителей награждают серебристым трофеем в форме тороида, выполненным дизайнером Олафуром Элиассоном. Кому-то он напоминает чёрную дыру, галактику или ДНК

Breakthrough Prize — "Оскар" мира науки Наука, Нобелевская премия, Научпоп, Оскар, Человек наук, Видео, Длиннопост

• Наряду с самим Breakthrough Prize, с 2015 года призом Breakthrough Junior Challenge награждаются школьники от 13 до 18 лет. 50 000$ учителю, 100 000$ школе на покупку научной лаборатории, и стипендия в 250 000$ школьнику на высшее образование за трехминутный ролик на YouTube с объяснением научной концепции


• Фонд также финансирует два научных благотворительных проекта Breakthrough Initiatives. К созданию инициативы приложили руку не только технические гиганты, но и такие популяризаторы науки как Стивен Хокинг и последователи Карла Сагана. Breakthrough Listen - программа по поиску внеземной разумной жизни во Вселенной которую курировал Хокинг, а Breakthrough Starshot занимается разработкой концепции межзвездного флота, способного совершить путешествие к Альфа Центавре за 20 земных лет


На церемонию 2020 вы уже опоздали - она проводилась 3 ноября 2019 года. Этот приз — он про будущее ;)


Церемония награждения Breakthrough Prize проводится в Первом Ангаре НАСА, в Маунтин-Вью в Калифорнии и больше напоминает церемонию Оскар (эти два события продюсирует один и тот же человек)


Её посещают не серьёзные дяденьки в строгих костюмах - такого там вообще нет! Туда идут по зову сердца. Знаменитости не получают за это гонорар, музыканты выступают на церемонии чтобы поздравить ученых, а приз вручают известные актеры, модели и CEO крупнейших технических компаний


В 2020 шоу вёл Джеймс Корден, и даже спел смешную песенку про “науку, достойную трёх миллионов”

Так и проходит это торжество: на сцене слышны всевозможные акценты - от русского до испанского, ведущие обязательно скажут несколько шуток об образе „типичного ученого“, и наука здесь поставлена во главу всего

Так что если хотите, чтобы когда-нибудь симпатичный блестящий тороид вам вручила Адриана Лима, а руку пожал Марк Цукерберг и Бенедикт Когтевран, придётся учить математику, постигать науку и открывать человечеству новые горизонты. По-другому никак

Breakthrough Prize — "Оскар" мира науки Наука, Нобелевская премия, Научпоп, Оскар, Человек наук, Видео, Длиннопост

В чудесные времена живём! Тони Старк бы нами гордился


Моя группа ВК и телеграм

Показать полностью 1 2
59

Как визуализировать данные? Виды графиков

Данные окружают нас повсюду. Цены на доллар и бензин, количество новорождённых в стране, температура на улице. Цифры сыпятся со всех сторон! Но гораздо приятнее смотреть на красивые картинки, чем на таблицы с числами. Как же красиво отобразить эти данные?

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Гистограмма

Представьте, что у вас есть данные по зарплатам всех людей в стране. Это может быть таблица Excel с единственным столбиком. Смотреть на миллионы чисел вам уж точно не хочется! Но интересно разбить людей на категории по зарплате. Берём одну «корзину» и складываем туда все строки таблицы, в которых записано меньше 15,4 тысяч рублей. Во вторую — людей с зарплатой от 15,4 до 21,8 тысяч и так далее. Получим такую картину:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост
Визуализация от Коммерсантъ, 2017 год. Современные данные можно найти на сайте росстата

Хотелось бы увидеть нормальное распределение — большую часть людей в центре, немного бедных людей (вряд ли можно полностью избавиться от бедности) и богачей по краям:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

К сожалению, это не так: левый «хвост» реального распределения тяжеловат. Благодаря гистограмме мы это увидели, дальше осталось лишь думать и делать выводы


Если данных совсем много, можно не визуализировать отдельные «корзины» в гистограмме, а смотреть только на сглаженную кривую (как на иллюстрации выше). Например, можно посмотреть на то, как изменялся доход на душу населения во времени:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост
Источник – очень интересное исследование

Стоблчатая диаграмма (bar plot)

В прошлом примере у нас было много чисел в одном столбце таблицы. Это было одно большое распределение, которое мы для удобства разбили на «корзины». Но иногда такие корзины есть в самих данных. Например, если бы у нас были данные о количестве людей, работающих в разных отраслях. Тогда мы бы смогли для каждой отрасли высотой столбца изобразить, как много человек в ней трудоустроены. Это и называется столбчатая диаграмма! Как пример – процент использования разных социальных сетей в мире в 2010-2019 годах:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Круговая диаграмма (pie chart)

Иногда данные составляют доли от чего-то целого. В примере выше, все люди, работающие в разных отраслях, в сумме составляют всё работающее население страны. Есть соблазн изобразить такие данные в виде круга и раскрасить секторы в разные цвета. Площадь сектора будет изображать количество людей, работающих в отрасли. Это называется «круговая», а на английском «пироговая» диаграмма. Например, рекомендованная диета:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Но такому соблазну лучше не поддаваться! Круговые диаграммы ужасны. Они красивы, но, как оказывается, наш мозг довольно плохо на вид оценивает площадь. Особенно если для секторов выбраны контрастные цвета или график сделан трёхмерным и под наклоном. Вот отличная иллюстрация того, как непросто оценивать круговые диаграммы:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

На первом графике сектора возрастают по площади от красного к чёрному. На втором они почти одинакового размера. А на третьем — наоборот, убывают. Но на первый взгляд диаграммы кажутся почти одинаковыми! Чтобы увидеть различия приходится внимательно в них вглядываться. А мы как раз хотим упростить понимание данных. Сравните с нижней частью рисунка чтобы понять, как просто ту же информацию извлечь из стобликов


Гифка о том, как сделать круговую диаграмму лучше:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Коротко — лучше не использовать круговые диаграммы вообще, если только вы не хотите намеренно запутать людей. Но иногда их использование уместно. Например, мне кажется удобной визуализация места на диске в Ubuntu. Это не совсем классический pie chart, но суть похожа. Можно рассмотреть сколько места занимает каждая папка, а затем её подпапки:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Иногда круговые диаграммы используют с настоящими пирогами, обыгрывая английское название:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Линейный график

Отлично подходит, когда между точками на графике есть какая-то связь. Например, временная. Когда вы можете сказать, что в разных точках что-то растёт или падает, по отношению к предыдущим, это именно тот случай, когда нужно использовать линейный график! Вот, например, график количества смертей от лесных пожаров по годам:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Цены акций, количество денег у вас на счету, количество заболевших какой-нибудь болезнью — всё это можно визуализировать именно так. Иногда для тех же данных используются и другие методы. Например, уже знакомая нам столбчатая диаграмма, где все столбики помещены друг на друга:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Или можно изображать визуализировать данные как площади, помещая их друг на друга:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

У этих видов графиков есть свои плюсы и минусы, но не будем останавливаться на них в этой статье. Можете предположить в комментариях, когда такая визуализация будет хорошей, а когда непонятной или некрасивой!


Точечный график (scatter plot)

На русском также называется «диаграмма рассеяния». Этот график помогает понять зависимость одной переменной от другой. Например, по одной оси откладывается площадь дома, а по второй его цена:

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Видно, что в целом, чем больше площадь дома, тем дороже он стоит (переменные коррелируют). Визуально видно и исключения: по цене ниже 200 тысяч есть дома с очень большой площадью


Такой вид графика хорош ещё и тем, что он показывает сырые данные, как они есть. Иногда графики отображают только средние значения или разброс точек вокруг средних. На диаграмме рассеяния же мы видим каждый дом в виде точки!


Иллюстрация ниже показывает, почему это может быть важно. У всех графиков на ней одинаковые средние по обеим осям. Более того, на всех графиках одинаковая дисперсия и корреляция между переменными. Не пугайтесь, если не знаете термины, они просто означают разброс данных и связь между переменными

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Все эти данные «одинаковые», если смотреть на средние, дисперсию или корреляцию, но благодаря простому графику очевидно, насколько они разные!


Недостаток такой визуализации в том, что она позволяет изобразить только две переменные. Если их в ваших данных три, то можно попробовать построить трёхмерный график. А если четыре? Такое изображение поймут только существа из фильмов Кристофера Нолана. А если переменных десять, то даже они не справятся


Хотя, используя разные цвета и формы точек, всё же можно изобразить на одном рисунке много переменных. На графике ниже изображены данные по возрасту актёров и актрис в фильмах. Каждая точка обозначает возраст главного актёра (по горизонтальной оси) и возраст главной актрисы (по вертикальной). Размер круга обозначает бюджет фильма, а цвета — конкретных актёров

Как визуализировать данные? Виды графиков Наука, Научпоп, Статистика, Данные, График, Человек наук, Визуализация, Гифка, Длиннопост

Видно, что в актёры обычно старше актрис. Кажется, что это различие ещё больше выражено в высокобюджетных фильмах. А цвета позволяют проследить карьеру каждого актёра. Целые четыре переменные мы уместили на плоскости! И смогли увидеть в данных много интересного

На этом сегодняшняя подборка завершается. Это были только самые базовые виды графиков. В арсенале аналитика есть также скрипичные графики, «ящики с усами» и многое другое! Если вам понравится пост, то сделаю продолжение :)


Моя группа ВК и телеграм-канал

Показать полностью 14
6

Уравнение идеального чая

Невозможно быть учёным только в рабочие часы. Научный склад ума накладывает отпечаток на все сферы жизни. Даже на чаепитие. Как следует заваривать чай, чтобы получить наибольшее удовольствие? Это маленький вопрос для науки, но очень важный для конкретного учёного!

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

Сперва нужно выделить факторы, которые могут повлиять на удовольствие от чаепития. Я пока что решил не пытаться выявить идеальное время заварки или количество кипятка. Также я ограничусь одним видом чёрного чая в пакетиках, который я привык пить с молоком. Другие сорта чая и переменные можно исследовать в будущем. А пока проверим три простые гипотезы:


1. Важно заливать чай молоком не сразу, а сперва дать ему завариться. Я обычно делал не так, но если ожидание поможет улучшить вкус чая, то это следует проверить!


2. Важно заливать чай кипятком. Если чайник закипел какое-то время назад и «бурление» уже прошло, то лучше поставить его кипятиться снова. Так всегда делала моя мама, и я с детства привык поступать также. Может быть, это не влияет на вкус и я зря каждый раз спешу залить чай кипятком


3. Влияние шоколада. Я очень люблю чай, как напиток, сам по себе. Помогает ли сладкое усиливать от него удовольствие или наоборот отвлекает от вкуса?

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

Своё удовольствие от чая я буду измерять в 10-бальной шкале. Но как в итоге понять, что повлияло на оценку больше всего? В этом нам поможет полный факторный эксперимент


Иногда нужно выяснить, как какая-то величина зависит от других параметров. Например, вы хотите понять, какие вещества нужно добавлять в сталь, чтобы она была как можно прочнее. Или какими лекарствами нужно лечить пациента, чтобы он поскорее выздоровел


Конечно, хочется попробовать все возможные сочетания всех возможных веществ. Но на это у сталелитейного завода не хватит денег, а у больницы – пациентов. Лучше исследовать действие всего нескольких факторов, воздействие которых, как вам кажется, может повлиять на результат. Испытаний также хочется провести как можно меньше

К счастью, существует теория планирования эксперимента, которая даёт вам готовую инструкцию. Если у вас есть N факторов, каждый из которых может находиться на 2 уровнях, то понадобится 2 в степени N испытаний. Например, для 3 факторов придётся поставить 8 разных опытов

Эксперимент следует проводить по такой схеме, как на рисунке внизу. Каждая строчка таблицы обозначает один опыт, а в столбцах – уровни фактора. В этой таблице «+» означает наличие фактора, а «» его отсутствие. На примере эксперимента с чаем: плюс в колонке с чайником значит, что в этом опыте я заливаю заварку кипятком, а минус – жду какое-то время

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

Проведя все опыты, мы поймём как действует каждый фактор на интересующую нас величину. И даже больше: мы поймём, как на неё влияет взаимодействие факторов! Например, шоколад сам по себе может не увеличивать удовольствие от чаепития, но доставлять его в сочетании с добавленным сразу молоком. А какие-то два компонента в составе стального сплава могут увеличивать его прочность только вместе, но не по отдельности


Осталось самое приятное – провести эксперимент. Каждый день после обеда я пил по чашке чая, случайно выбирая строку из таблицы и выписывал своё удовольствие в баллах. У меня получился такой результат:

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

После того, как все строки заполнены нужно сделать несколько действий и получить долгожданное уравнение идеального чая!


1. Сложить все баллы удовольствия и поделить на количество экспериментов (посчитать среднее арифметическое). В уравнении это будет моё базовый уровень удовольствия от чая


2. Добавить столбцы для взаимодействий факторов. Например, в столбце «Взаимодействие молока и шоколада» будут плюсы только если знаки в столбцах «Молоко сразу» и «Шоколад» одинаковы. Кроме этого взаимодействия нужно добавить ещё 3 столбца (в том числе, тот, в котором будут все 3 фактора)

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

3. Посчитать коэффициенты уравнения! Для каждого из столбцов нужно сложить баллы удовольствия в тех строках, где в столбце стоят плюсы и вычесть баллы удовольствия в строках с минусами


4. Выбросить незначимые коэффициенты. Для этого нужно совсем немного применения статистики. Но чтобы не пугать читателей формулами, скажем просто, что слишком маленькие коэффициенты выбрасываются


Вот и всё, уравнение получено! У меня оно вышло таким:

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

В этом уравнении вместо молока нужно поставить единицу, если мы льём его в чай сразу после кипятка и минус единицу, если льём спустя минуту. Точно также для остальных факторов. Там где их несколько, знаки от отдельных факторов нужно перемножить


Какие можно сделать выводы? Мой базовый уровень удовольствия от чая – 65 баллов. Если лить молоко сразу после кипятка, то оно сразу же понижается на 5 баллов (а если подождать – повышается на 5). Шоколад также мешает наслаждаться любимым напитком и снижает удовольствие на 3 балла (а вместе с молоком – ещё на 3). Если же сразу добавить молоко, есть шоколад и залить заварку кипятком, то можно вернуть себе 3 балла удовольствия. Чтобы вернуться к десятибальной шкале нужно поделить всё на 8


Забавно, что коэффициент при «кипятке» оказался слишком маленьким – статистически незначимым. Значит, для меня нет разницы заливать чай кипящей водой или подождать, пока она немного остынет в чайнике. Это сделало мою жизнь немного спокойнее

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

Эксперимент, конечно, можно улучшить. Например, я всегда знал, какой набор факторов заварен в моей чашке. Мои предположения о результатах эксперимента могли повлиять на его результат. Если бы чай заваривал кто-то другой, а я не знал, залит ли он кипятком сразу, результат был бы объективнее. Это называется «ослепление» и применяется в исследованиях эффективности лекарств


Также был проведён всего один опыт для каждого набора переменных. Это помогло получить результат всего за 8 дней, но могло исказить результаты. Например, если в какой-то день у меня было хуже настроение, чем в другие и чай казался невкусным (или наоборот — значительно его поднимал)

Уравнение идеального чая Наука, Эксперимент, Чай, Человек наук, Математика, Длиннопост

Сможете ли вы найти комбинацию факторов, которые сделают удовольствие от чая в моём уравнении максимальным? А как бы выглядел ваш идеальный чай?

Моя группа ВК и телеграм

Показать полностью 7
22

Пандемия, самоизоляция и теория игр

Почему люди нарушают самоизоляцию? Постараемся ответить на этот вопрос при помощи теории игр


Эпидемия COVID-19 шагает по миру. Нам приходится привыкать носить маски, тщательно мыть руки и проводить больше времени дома. Во многих странах был введён режим карантина и самоизоляции. Но будут ли люди осознанно сидеть дома во имя блага общества? Постараемся ответить на этот вопрос с помощью теории игр

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Индекс самоизоляции в Москве

На момент написания этого поста пандемия длится уже больше двух месяцев. С момента обнаружения вируса прошло почти пол года. От эпидемии умерли сотни тысяч людей, страдает экономика всего мира. И это ещё не конец: не все страны преодолели плато заболеваемости, а учёные опасаются второй волны


SARS-CoV-2 – коронавирус-виновник такой ситуации – способен существовать всего около недели на металле и пластике, и ещё меньше на других поверхностях. Летучие мыши, и панголины, которые являются возможным источником вируса также не бегают по городам, заражая людей. Всё это время вирус распространяется от человека к человеку

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Задумайтесь, как это странно. Вирус может быть обнаружен в дыхательных путях пациента в среднем около 2 недель после появления первых симптомов (в фекалиях – дольше). Было бы достаточно всем посидеть дома около месяца и не есть фекалии соблюдать правила гигиены для того, чтобы остановить распространение инфекции. Это бы спасло тысячи жизней и в конце концов пошло бы на пользу экономике. Почему же этого не произошло? Мир страдает от пандемии уже не первый месяц и с нетерпением ждёт появления вакцины

Выпадение всего одного звена в этой цепочке может спасти сотни людей. Оставайтесь дома: это спасает жизни

Если вы читаете этот пост не из будущего, то вам достаточно выглянуть в окно, чтобы дать ответ на этот вопрос. Во многих городах режим не является слишком строгим и люди могут свободно выходить на улицу. Ответственность за самоизоляцию лежит на плечах каждого. И каждый волен выбирать, выходить ему на улицу или оставаться дома

Поведение людей в таких ситуациях хорошо описывает теория игр. Давайте сделаем краткое отступление от эпидемиологии и поговорим о математике

Дилемма заключённого

Представьте 2 преступников, которые попались полиции. Каждый из них ограбил аптеку в надежде запастись медицинскими масками. Это уже не первое такое проишествие, но другие не были раскрыты. Полиция бросает преступников в разные камеры и допрашивает в надежде пролить свет и на прошлые ограбления

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

В наше время и балаклавы не нужны

Каждому из заключённых ставятся следующие условия. Он может засвидетельствовать, что второй грабитель совершил предыдущие преступления. Если второй грабитель при этом промолчит, то свидетеля отпустят, а на его коллегу повесят все прошлые ограбления и дадут срок 20 лет. Медицинские маски – это сейчас не шутки, знаете ли. Если и второй грабитель пожалуется на первого, то оба получат срок 5 лет. Если же оба промолчат, то им предстоит самоизолироваться в камере весь следующий год

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Самый маленький суммарный срок, 2 года, получается, если оба грабителя промолчат. Это самое рациональное решение, если воспринимать преступников как единое целое, пусть и маленькое, общество. Однако они сами вряд ли думают о себе, как об обществе. Каждый из них заинтересован в том, чтобы лично его срок был как можно меньше. Тогда молчать будет нерационально, ведь оппонент также заинтересован в сокращении своего срока и охотно пожалуется, сократив его до нуля

Получается, что каждый из преступников не может дать своему оппоненту преимущество. Тогда действием с максимальной личной пользой будет сдать второго грабителя. Так поведут себя оба заключённых и в итоге оба сядут на 5 лет! При рациональных действиях, но ради личных мотивов, каждый заключённый проведёт на 4 года больше в тюрьме, чем мог бы при сотрудничестве. Зато оба не будут ходить по улице во время пандемии

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Теория игр рассматривает такие и другие не менее интересные ситуации. Игрой в рамках этой теории называется конфликтная ситуация со следующими условиями:

1. Участвует некоторое конечное или бесконечное число игроков

2. Заранее заданы правила игры – способ выбора стратегии игроком

3. Определены количественные величины выигрышей и проигрышей участников игры

Дилемма заключённого соответствует этим правилам – в ней участвует 2 игрока, каждый имеет 2 возможных «хода» и стремится минимизировать свой срок, а этот срок определён при любых действиях игроков

Но как у любой другой области математики, прелесть теории игр в том, что она может описывать любые ситуации, модель которых вписывается в эти правила. С помощью этой теории можно объяснять экономические процессы, эволюцию, распространение религий. Игроками могут выступать предприятия, государства, отдельные люди или даже природные стихии

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Как игру можно представить и соблюдение режима самоизоляции. Игроками здесь выступают жители города. Каждый день они «делают ход» – выбирают выйти сегодня погулять или остаться дома

Давайте построим простую модель, чтобы количественно определить возможный выигрыш. Зададим каждому человеку «настроение», выражаемое целым числом. Настроение будет повышаться на единицу, когда человек выходит погулять и понижаться на единицу, если он останется дома. Для простоты модели мы исключим из неё интровертов-домоседов. Если человеку приятнее сидеть дома, это прекрасно, но в рамках этой игры он нас не интересует

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Теперь нужно определить правила, по которым каждый житель будет выбирать свой ход. В городе распространяется эпидемия и гуляя, игрок рискует заболеть. Пусть вероятность заболевания при выходе на улицу будет равна проценту заболевших от населения города. Например, если в городе 10% заражённых, то гуляя, человек имеет 10% вероятность заболевания. В таком случае его настроение опустится до нуля

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Пусть игрок выходит на улицу, если математическое ожидание его настроения в этом случае будет больше его текущего настроения. То есть:

вероятность незаражения * (настроение + 1) > настроение

Простыми выкладками можно показать, что человек будет выходить на улицу, если его настроение выше, чем отношение количества здоровых людей к количеству больных людей в городе

Из этого следует что:

• При нулевом настроении, человек в любом случае пойдёт на улицу. Дома сидеть ему уже невмоготу

• При долгом сидении дома у человека накапливается усталость и ему всё больше хочется прогуляться. Рано или поздно может наступить момент, когда несмотря на количество заболевших в городе, человек выходит из дома, подвергая себя опасности и ещё больше ухудшая эпидемиологическую обстановку

Модель описана, давайте же посмотрим, как она себя ведёт. Для этого я написал небольшую программу. Кроме описанных выше правил я также добавил вероятность выздоровления для больных людей, равную 1/14 (в среднем за 2 недели человек выздоравливает). Такие люди становятся резистентными и более не распространяют инфекцию. В первый день болеет только один человек. Настроение у населения в начале распределено равномерно – от 1 до 15

Запустив модель 1000 раз для города с населением 1000 человек я получил такую картину:

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

По горизонтальной оси здесь отложены дни. Цветами показано среднее за 1000 запусков модели количество больных (красный), здоровых (синий) и резистентных (зелёный) людей. Чёрная линия отражает количество людей, вышедших на улицу в этот день. Белая линия – это среднее настроение всего населения, её ось можно увидеть справа

В самом начале болеет очень мало человек, поэтому большая часть людей выходит на улицу и среднее настроение населения повышается. Но очень скоро инфекция начинает стремительно распространяться и для многих людей порог риска оказывается выше их настроения. Они запасаются гречкой и туалетной бумагой и запираются дома (резкое падение чёрной линии). Это немного снижает скорость роста заболеваемости

Но настроение людей в такой ситуации становится всё хуже. Накапливается усталость и хочется выйти из дома. В какой-то момент настроение человека становится настолько низким, что его не пугает даже высокий процент заболеваемости. Люди снова начинают выходить на улицу, причём всё больше. На графике виден этот парадоксальный момент – заболеваемость приближается к пику, но люди гуляют всё больше и больше, ещё сильнее распространяя инфекцию!

Рано или поздно болеть или распространять инфекцию уже почти некому и она сходит на нет. Но на пике заболеваемость здесь достигла 40% населения города. Кстати, заметим, что «Резистентные» люди в этой модели почти не отличаются от погибших от заболевания: и те, и другие не распространяют болезнь. Поэтому можно воспринимать часть резистентных как погибших, а не как вылечившихся, хотя тогда они, конечно, не должны поднимать среднее настроение

Давайте теперь представим другой город, в котором после достижения порога в 1% заболеваемости был объявлен строгий карантин и всё население было обязано сидеть дома до тех пор, пока все заболевшие не вылечатся

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

Несмотря на то, что даже 1% – это колоссальное число для реальных городов, увеличим его до 10%, чтобы было проще смотреть на график

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

В обоих случаях порог достигается довольно быстро и население вынуждено сидеть дома. Это ведёт к драматическому падению настроения. Обратите внимание на правую ось – среднее настроение населения ушло в минус. Каждый конкретный человек чувствует себя значительно хуже, чем в первой ситуации (конечно, он остаётся здоровым, но мы не вписывали в модель тяжесть заболевания). Зато количество заболевших не преодолевает заданный порог. А после снятия карантина вновь можно свободно гулять и восстанавливать экономику. Общество в целом от этого выигрывает

С другой стороны, у этого есть ещё один интересный эффект. Количество переболевших людей невелико, а значит коллективный иммунитет у населения не формируется. И после снятия карантина первый же заражённый приезжий заставит картину повториться

Может быть именно поэтому в городах не вводится слишком строгий режим. Даже в модели с порогом в 1%, средняя длительность карантина составила 44 дня. За этот же период большая часть населения в модели без карантина приобрела резистентность. Поэтому суть самоизоляции не в том, чтобы остановить эпидемию, а в том, чтобы замедлить её распространение так, чтобы система здравоохранения справилась с поступающими больными. Это часто называют «сглаживанием кривой»

Оранжевая линия на гифке обозначает количество людей, которых способны обслужить больницы

Сделаем вывод. С точки зрения теории игр, человек будет нарушать режим самоизоляции пока его личный выигрыш от этого перевешивает возможные неудобства. К неудобствам относятся риск заболеть, штрафы, необходимость носить маски и так далее. Это именно тот рычаг, на который может воздействовать администрация страны/региона/города. Ведь большинство людей всё же думают о своём личном комфорте, а не о благополучии общества в целом. Даже если действия ради своих интересов приводят к худшей ситуации для общества и в конечном итоге для самого человека


Мне хотелось бы призвать вас быть ответственнее. Каждая мера безопасности, предпринятая вами, каждый день, проведённый дома, делает ваш город немного безопаснее. В конце концов, это хорошо и для вас

Пандемия, самоизоляция и теория игр Наука, Научпоп, Коронавирус, Теория игр, Пандемия, Эпидемия, Человек наук, Видео, Длиннопост

И напоследок: модели в посте не призваны точно отражать реальное положение дел, они несут скорее иллюстративный характер. Например, в них не учтён инкубационный период, хотя было бы интересно оценить его влияние. Также вероятность подхватить инфекцию зависит не только от доли заболевших в городе, но и от количества людей, которых человек встретит, гуляя. Но я стремился сократить количество параметров, чтобы передать лишь основную мысль. Почти не имеет смысла смотреть на абсолютные значения заболеваемости/длительности инфекции в этих моделях, но имеет смысл сравнивать ситуацию с карантином и ситуацию без карантина


Как говорил британский статистик Джордж Бокс:

Все модели неверны, но некоторые из них полезны

Спасибо за чтение, я буду рад вопросам (касательно математики, но не политики) и здравой критике. Оставайтесь дома! А если вам интересны мои посты, можете заглянуть в мою группу ВК и телеграм

Показать полностью 11 2
221

Забавные математические теоремы

Математика не обязана быть скучной. Напротив, это одна из самых творческих наук! В доказательство того, что математики — тоже люди с чувством юмора, я подобрал теоремы с самыми интересными названиями

Теорема о причёсывании ежа

Представьте ежа, свернувшегося клубком так, что во все стороны торчат иголки

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Эта теорема утверждает, что невозможно причесать ежа так, что ни один волосок не будет торчать. Всегда, как бы мы не пытались это сделать, хоть одна иголка будет направлена перпендикулярно поверхности ёжика

Что довольно круто, это не просто забавная теорема, из неё имеется масса полезнейших следствий. Конечно, доказывалась она не для ежа: в задаче рассматривается сфера, покрытая векторами. Прелесть математики в том, что доказывая что-либо для абстрактного объекта, мы можем прикладывать это к массе реальных. Можно взять в качестве примера сферы с векторами ёжика с иголками. А можно — целую планету! Векторы на поверхности планеты могут означать направление ветра. И, как следует из этой теоремы, на планете всегда есть точка, в которой ветра нет. Что бы ни творилось на остальной её части

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Теорема о бутерброде с ветчиной

Представьте бутерброд из хлеба, сыра и ветчины (можно из любых других трёх ингредиентов на ваш вкус)

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Теорема утверждает, что такой бутерброд всегда можно разрезать одним движением ножа так, чтобы и ветчина, и сыр, и хлеб были разделены на 2 равные части

В естественных науках (например, в биологии) "всегда" стараются не говорить: рано или поздно найдётся теория получше. В математике же "всегда" значит вообще всегда. Доказанная теорема верна навеки в рамках условий, оговорённых в доказательстве. Это значит, что какой бы формы ни был бутерброд, вы сможете честно разделить его с другом одним движением ножа

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Тот же математик позже доказал теорему о том, что любой пирог можно разделить на троих людей так, чтобы каждый остался доволен

Теорема волшебной палочки

Представьте комнату в форме многоугольника, сделанную из зеркал. Главное, чтобы углы, под которыми сходятся стены можно было записать как рациональные числа. Например, 90 градусов или 2/3, но не Пи градусов

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Теорема утверждает, что если в центр комнаты поместить волшебную палочку и сказать «Люмос» (или поместить свечу, если вы магл), вся комната будет освещена, тёмных пятен не останется

Теорема о двух милиционерах

Представьте, что есть три функции. Причём значение какой-нибудь из них находится между двумя другими: не меньше одной, но и не больше второй. Теорема утверждает, что если две эти функции в пределе стремятся к какому-либо значению, то и функция посередине стремится к этому же значению

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Другими словами, если 2 полицейских идут в участок, то и человек между ними направляется туда же

Задача со счастливым концом

А напоследок — милая история. Представьте 5 точек на плоскости. Утверждается, что как бы эти точки не были расположены, среди них всегда найдутся 4 точки, которые являются вершинами выпуклого прямоугольника

Забавные математические теоремы Математика, Наука, Научпоп, Человек наук, Длиннопост

Счастливый конец же задачу ждал не в математическом, а в реальном мире. Её решение привело к свадьбе нашедшего его математика

И это лишь часть от огромного количества интересных и красивых историй из мира математики!

Моя группа ВК

Показать полностью 6
Отличная работа, все прочитано!