Чеканная шайба: как влияет финансирование клуба на результат хоккейного сезона?
Всем привет! Давно читаю пикабу, решил, что пришло время самому что-то написать. Я финансовый аналитик, в свободное от работы время изучаю статистику и программирование. Думаю, что многие слышали про такой концепт в бейсболе - moneyball. Он подразумевает, что клубы c наибольшим финансированием, обладают более высокими шансами на успех в сезоне. Решил проверить работает ли что-то такое в КХЛ. Дальше будет много буков и графиков. Заранее предупреждаю, что данная статья не является гайдом к ставкам или чему-то подобному. Я просто изучил статистику и хочу поделиться своими выводами с сообществом. За все ошибки в тексте готов понести наказание заранее приношу извинения. Погнали!
Для начала, я взял 25 команд КХЛ и разместил их соответсвенно количеству набранных очков в сезоне 2018-2019 (сами понимаете, 2019-2020 выдался каким-то никаким). К общей статистике, были также добавлены бюджеты и количество игроков в каждой команде. Статистику по клубу я взял с сайта КХЛ (место, выигрыш, проигрыш, игр сыграно и т.д.). С бюджетами пришлось подзаморочиться. Их я взял с championat.com вот тут и тут.
Согласно данным, в среднем, клубы КХЛ потратили 980 млн., +/- 583 млн. Не плохо, так? Что еще интереснее, ЦСКА потратил 2172 млн., (больше других), меньше всех Адмирал (21 место в регулярке). С первого взгляда, хочется сказать, что всё очевидно. Утверджение работает, но как-то не до конца. Адмирал должен был занять последнее место, но занял 21 (Амур потратил в 2,5 раз больше денег, а стал 23 в чемпионате или Слован (№25), бюджет которого на 75% больше). Так что посмотрим как это работает в общем виде.
Я решил посмотреть на следующие параметры:
1. Сколько (в среднем) клубы тратят на игру (бюджет/игру).
2. Сколько (в среднем) клубы тратят на выигрыш(бюджет/выигранную игру).
3. Сколько (в среднем) клубы тратят на игрока (бюджет/на количество игроков в команде).
Чтобы было нагляднее, добавлю три соответствующих усатых куба.
Теперь, ответим на поставленные ранее вопросы и получаем, что:
1. Средний бюджет клуба КХЛ = 980720000, с отклонением в +/- 582464914
2. В среднем, выигранная игра обходится клубу КХЛ в 30129482 с отклонением в +/- 11057757, но тут нужно учитывать, что у каждого клуба разное количество выигрышей. Так, ЦСКА (1 место, 85% побед), за каждый выигрыш отдала 40981132, а Слован (25 место, 24% побед) отдал 23200000. Этот вопрос у меня вызвал любопытство, о нём чуть ниже.
3. В среднем, на игрока выплачивается 25747465.56 с отклонением в +/- 15272996.54. Другими словами, если вы хоккеист в основной лиге (КХЛ), в одном из 25 клубов, значит, что ваша зарплата где-то в диапозоне от 10474469 до 41020462, что в целом довольно неплохо.
Как было сказано, второй вопрос меня заинтриговал. Если сравнить коэффициент побед (кол-во игр выигранных/игр сыгранных) и бюджет на выигранную игру, то можно придти к двум вещам:
1. Можно установить линейное отношение
2. Возможно, некоторые клубы переплатили за победу.
По порядочку. Первым делом накидаем точечный график, где Y=коэффициент побед, а X=денег потрачено (другими словами, зависит ли Y от X, и можно ли от одной X делать предположение относительно Y). Вот что показывает график.
На графике мы видим, что точки не центрируются и, вообще, разбросаны в рандомном порядке. Есть, например, Барыс и Йокерит, которые выиграли больше 50% игр, но заплатили чуть меньше (около 30 млн) за каждую победу. И есть АК Барс и Салават Юлаев, которые запалтили больше всех, но их коэффициенты так себе (60% и 52% соответственно). В общем, довольно таки интересно и не очень понятно, но можно сказать одно: высокий бюджет не будет тебе гарантировать победу за победой. Слован, к примеру, последнее место в регулярке, заплатил больше, чем Йокерит и Барыс (8 и 5 места). Так что, очевидно, есть в этом всём что-то, что не зависит от бюджета.
Тем ни менее, упростим задачу и нарисуем такой же график, но в этот раз оставим бюджет таким, какой он есть.
Сейчас тренд выглядит немного лучше. Мы видим, что чем больше клуб платит, тем больше он выигрывает. И все равно, есть определенные клубы, которые платят меньше, но выигрывают больше. Кроме того, корреляция между бюджетом клуба и коэффициентом побед составляет: 0.827521271436483 или 83%. И есть примерно 13% некоррелируемых клубов, которые выпадают из общего тренда.
Сначала я подумал, что, возможно, клубы с большими бюджетами покупают больше игроков, но оказалось, что корреляция между количеством игроков в клубах и коэффициентом побед примерно 20%, что достаточно мало. И это логично, так как тут определяющим фактором будет не количество, а качество (это я измерить не могу). Кроме того, регрессия показала, что этот фактор (количество игроков) вообще ни на что не влияет, так что откинем его в сторонку и сконцентрируемся на бюджетах.
Вопрос, который волнует меня больше всего: сколько надо заплатить, чтобы выиграть регулярку? Для этого я немного пошаманил перевел цифры бюджетов в другой формат, чтобу установить, насколько больше или меньше среднего платит каждый клуб и вот что получил. Бюджетный коэффициент показывает насколько больше/меньше среднего бюджет каждого клуба c учетом отклонения. Клубы в данном списке расположены в соответствии с местом, которое они заняли в регулярке. Если следовать основной гипотезе (больше платишь-выше результат), то получится следующее
То есть, мы можем сказать, что вероятнее всего клуб, который платит больше, займет место выше. Может быть отклонение. Последним этапом, я построю регрессивную модель, которая, на основе этих данных покажет какой коэффициент бюджета должен быть, чтобы обогнать по победам ЦСКА (85%). Если взять средний бюджет всех клубов и конвертировать его в Z-score, то выходит, что коэффициент побед будет всего 27% (17 выигрынных игр из 62). Всё равно лучше, чем Слован. Дальше, я провёл анализ монте-карло, чтобы подобрать бюджет, при котором команда сможет получить коэффициент побед выше, чем у ЦСКА.
Если верить статистике, то, чтобы иметь коэффициент побед выше 85% (коэффициент ЦСКА), то придется выложить примерно 2530257600.00 и коэффициент будет примерно 86%. В этом я уверен на все 68% (если, конечно, ваша команда не одна из выходящих за рамки статистики). Не исключаю также, что клуб мог переплатить за победу, отрыв между третьим и четвыртым местом целых 10% (Автомобилист=76% (3 место), Локомотив = 65% (4 место)). А чтобы выиграть 100% игр, понадобится 3030424800 (в 3 раза больше среднего дают нам 97% коэффициент побед). Вот такой вот график получается по модели. Знаю, выглядит слишком прямо, но, на то она и статистика, чтобы давать приблизительный результат.
Короче, весь хоккей - это такой же спорт как и футбол, баскетбол и бейсбол. И, это доказано статистически. Поэтому, если у вас есть желание заиметь собственную хоккейную команду, предлагаю Вам найти доброго и богатого друга (если вы таковым не являетесь). Самое очевидное объяснение: больше денег-лучше игроки, клюшки, коньки и т.д., но это не доказано статистически. Причины и разборы игроков я бы оставил на другой пост.
Всем интересных открытий!




















