Ошибки алгоритмов: когда цифры не отражают реальность
Футбольная аналитика сегодня опирается на десятки метрик. xG, xThreat, PPDA, possession value, progressive passes — цифр много, и создается ощущение, что игру можно посчитать почти полностью. Но на практике даже продвинутые модели регулярно дают искаженную картину.
xG как главный источник иллюзий
xG оценивает вероятность гола исходя из точки удара, типа передачи, угла, части тела и еще ряда параметров. Но модель не учитывает несколько ключевых вещей:
– положение защитников в момент удара
– баланс тела игрока
– давление не ближайшего, а второго защитника
– скорость развития атаки
– качество первого касания
Два удара с одинаковым xG 0.25 могут быть абсолютно разными по реальной опасности. Один — после резкой вертикальной передачи в разрез, второй — с полумомента, когда игроку просто пришлось бить.
Владение мячом и его обманчивость
Possession фиксирует время контроля, но не фиксирует ценность этого контроля.
70% владения может состоять из:
– передач между центральными защитниками
– горизонтального переката без продвижения
– возвратов назад под давлением
При этом команда с 30% владения может иметь более высокий показатель xThreat и больше касаний в штрафной.
Удары, которые ничего не значат
Shot count — одна из самых переоцененных метрик.
Проблемы начинаются, когда:
– удары наносятся из-за штрафной без подготовки
– атака заканчивается ударом как вынужденным решением
– команда сознательно бьет, чтобы «завершить» фазу
В цифрах это выглядит как активность. В реальности — как отсутствие идей.
PPDA и прессинг без учета контекста
PPDA показывает, насколько высоко команда прессингует, но не отвечает на вопрос — зачем.
Команда может:
– прессинговать высоко, но без компактности
– допускать легкие вертикальные передачи
– терять структуру при первом обыгрыше
Формально PPDA низкий, фактически прессинг не работает.
Почему алгоритмы ломаются
Модели плохо работают с командами, которые:
– сознательно отдают инициативу
– играют через вертикальные переходы
– используют ложные фланги
– не стремятся контролировать мяч
Такие команды почти всегда недооценены по «бумажным» метрикам, но стабильно создают опасные моменты.
Самая большая слепая зона цифр
Алгоритмы почти не видят:
– тайминги рывков без мяча
– позиционные ловушки
– психологическое состояние после гола
– изменение рисков по ходу матча
После забитого мяча одна команда режет темп, другая ломает структуру. Цифры продолжают накапливаться, но их качество резко падает.
Как читать статистику правильно
Если смотреть только на цифры — всегда будет перекос.
Рабочий подход выглядит так:
– сначала стиль команды
– потом фаза матча
– затем поведение при счете
– и только после этого цифры
Метрики не должны отвечать на вопрос кто сильнее. Они должны помогать понять почему так выглядит игра.
Итог
Футбол нельзя свести к формулам без потерь. Чем сложнее модель, тем больше она зависит от допущений. Цифры — это карта, а не территория. И если карта говорит одно, а поле — другое, почти всегда стоит верить полю.
