Я много работаю с данными. Часто при этом приходится строить графики. Иногда они получаются довольно забавными или просто красивыми. Вот подборка таких графиков:
Это гистограмма по данным из домашнего задания по статистике. Здесь я исследовал нормальное распределение с выбросами. Нормальное распределение – это когда часто попадаются "средние" наблюдения и реже другие. Например, нормально распределён рост у людей одного пола: у большинства он промежуточный, но есть меньшее количество высоких и низких людей
В этих данных среднее равно нулю. Здесь к нормальному распределению примешано распределение Коши: оно ведёт себя непредсказуемым образом, выдавая то очень большие, то очень маленькие значения. Картина получилась похожей на ландшафт Дубаи с небоскрёбом Бурдж Халифа в центре
2. Мандаринки отбрасывают тень на стол, вид сверху
Снова данные из домашнего задания по статистике. Сами по себе они ничего не означают, я использовал их для отработки методов по поиску необычных значений – выбросов. Например, как точки снизу справа: они явно выбиваются из общей картины
Для того, чтобы применить статистический метод, мне нужно было "центрировать данные": переместить точки так, чтобы средние значения были равны нулю по обоим осям. После этого я решил удостовериться, что операция сработала правильно. Построил график, где исходные данные изображены синим, а центрированные – оранжевым цветом. Получилось похоже на мандаринки на столе
3. Распределение Бэтмена
Однажды мне нужно было изобразить моё любимое распределение. Тогда я в шутку нарисовал кривую, которую назвал распределением Бэтмена. Шутка зашла довольно далеко: теперь я часто применяю это распределение, когда нужно проверить что-то на необычных данных. А однажды по работе мне нужно было показать некоторые математические преобразования над кривыми. Я снова использовал кривую Бэтмена. Было довольно забавно презентовать серьёзным людям, как изменяется форма головы Бэтмена, и получать за это деньги
Вот пример картинки с презентации. Идея в том, чтобы применять к кривой операции, которые изменяют её, но в целом сохраняют форму. Голова Бэтмена подошла для демонстрации идеи идеально:
Здесь я проверял качество работы одной статистической процедуры. Правильный ответ, который она должна была выдавать – 395. По графику плотности видно, что в большинстве случаев так и есть. Но иногда попадались значительно меньшие значения, которые сформировали "хвост" распределения. Так получился график, похожий на ската