Вопрос по игровой статистике.

Привет, Пикабу! Хотел бы задать вопрос к адептам мат статистики.
Сначала, изложу условие задачи.

Допустим, вы играете в игру, где за каждую победу или поражение вам дается N или -N очков соответственно.
В конечном итоге, вы просто видите цифры вроде : "победа +30", "поражение -24", победа + 40 и т д. Отношение побед к общему числу игр зависит от множество факторов, но напрямую не зависит от игрока(помимо него, исход игры зависит еще от некоторого числа человек) и находится в районе 45-55%.

N(получаемые очки) зависит от следующих факторов:
1) Неизвестная составляющая. Известно, что в расчете, в той или иной мере, участвуют какие-то переменные, которые невозможно установить извне, не зная точную формулу расчета N. В какой мере они влияют на конечное N неизвестно, но известно, что влияние остальных факторов(кроме этого "неизвестного") значительно и не может быть проигнорировано как погрешность.
2) Некоторые параметры, зависящие от игрока, X, Y, Z. Эти параметры определяют личный навык игрока. Это может быть внимательность, скорость реакции, и т п, не важно.

Нужно понять в какой степени X Y и Z влияют на N. Т е, что оказывает наибольшее влияние, что наименьшее и т. д.

Как я вижу решение(ни разу не математик, так что ,возможно, все неправильно):
1) Вычислить среднее значение N, получаемое только от побед - winN
2) Вычислить среднее N только для поражений - loseN
3) Взять среднее X - aproxX, Y - aproxY и Z - aproxZ.
4) Соотв, получится, что наибольшее из aproxX, aproxY, aproxZ будет наибольшим образом влиять на N, получаемое за победу или поражение.

Правильно ли я понимаю решение, или нужно считать как-то иначе?

Спасибо за ваше время.

Лига математиков

578 постов2.4K подписчик

Добавить пост
Автор поста оценил этот комментарий

<неизвестный фактор> приводит к тому, что любая зависимость идея установления a, b, c- может быть неверна, так как неизвестный фактор может включать в себя X Y Z.

какой вид статистики у вас есть?
что о ней известно (изменения по xyz, по неизвестному фактору)?

Если есть выборка с изменением только 1 параметра (например Х), то можно попробовать дифференциал по ней, и по виду ф-ции понять есть ли зависимость от Х в <неизвестный фактор> или нет.
точнее есть ли не линейная зависимость в этом факторе. если нет, то значение этого диффиринциала будет как раз значением константы.

И так повторяем для всех 3ех.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Достоверно известно только то, что есть прирост очков N за каждую победу и есть факторы(точность, урон и т п, назовем их X Y Z), которые как-то влияют на N. Их можно отследить для каждой игры.Известно, что N считается, используя эти значения. Как именно - неизвестно. Есть только предположение.

Да, спасибо за ответ, выборка по одному параметру(где остальные близки к среднему, т е "почти" одинаковые и являются погрешностью) это вариант. Уже не один раз в комментах намекают на такой способ и да, это выглядит наиболее логичным.

Кстати, по-идее, я могу брать не абсолютные значения N,X,Y,Z, а их отклонение от среднего значения по всей выборке. В результате получится(для X) два графика Х и N,(остальные параметры изменяются пренебрежительно мало в сравнении со средним значением), на котором получится(или нет) проследить тенденцию. Что думаете насчет такого варианта?
Правда, все это оочень примерно, потому как влиять могут еще какие-то факторы, о которых неизвестно(и они точно есть), но..супер точность и не нужна.

Автор поста оценил этот комментарий
Думаю, сначала надо разобраться с постановкой задачи.

Как считать скиллы? Нужно описать правила. Например, навык "скорость реакции". Чел, реагирующий на определенную ситуацию за 0,5 сек быстрее игрока, реагирующего за 1 сек в 2 раза? Или там логарифмическая, экспоненциальная шкала?

Потом что значит "в какой степени X, Y, Z влияют N"? Не факт что там будет хорошо работать линейная модель весX*X+весY*Y+...=Вероятность_победы. Скорее всего, вклад каждого навыка - тоже функция от значений других навыков. Что если, например, X сильно повышает вероятность победы только при Y>b; а если Z>c, рост целевой функции тащит он? Тогда какой навык "влиятельнее"?
раскрыть ветку (1)
Автор поста оценил этот комментарий

Я думаю, там сравнивается значение параметра игрока со средним по миру/рангу.
Например, у игрока меткость 45%, в мире среднее 40 - соотв, чем больше разницы со средним, тем, по-идее, выше должно быть N в итоге.

//Что если, например, X сильно повышает вероятность победы только при Y>b; а если Z>c, рост целевой функции тащит он?
Ток не "вероятность победы" а, "число очков за победу", но сут та же. Тогда фейл, да.

У меня было предположение, что если в ходе одной серии экспериментов(100 игр например) посмотреть как меняется N, X, Y, Z (т е для каждой игры мы смотрим насколько каждый параметр отличается от среднего) Соотв, у нас получается таблица "дельта значений" для N X Y Z, по которым, может быть, можно установить какую-то закономерность. Как минимум, можно свети в график(мжет есть какие методы анализа...но я хз), хотя, не факт, что это что-то даст.

Но если там динамические коэффициент, то тогда, видимо, фейл, да.

1
Автор поста оценил этот комментарий

Вот с линейности нужно было начинать, а то я уже было начал писать полотно по этому поводу.

Насколько я понял концепцию этого неизвестного фактора, при большом количестве экспериментов его среднее значение будет стремиться к константе. То есть формулу можно свести к виду N = a * X + b * Y + с * Z + d, где d - усредненное значение неизвестного фактора по большому количеству экспериментов.

Тогда можно изменять каждый параметр по отдельности, чтобы узнать коэффициенты. Например, можно провести две группы экспериментов: одну с параметрами X1, Y, Z и вторую с X2, Y, Z. Тогда получим формулы для N:

N1 = a * X1 + b * Y + с * Z + d

N2 = a * X2 + b * Y + с * Z + d

Вычитая одно из другого, получим:

N1 - N2 = a * (X1 - X2)

И отсюда несложно видеть, что коэффициент a вычисляется как

a = (N1 - N2)/(X1 - X2)

Аналогично поступаем с b и c, сравниваем, получаем ответ.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Иными словами, проводим несколько игр, где стараемся поддерживать X максимальным.
Затем, проводим несколько игр, где намеренно занижаем X как можем.


А затем, ищем коэффициент за счет разницы? Будет погрешность, но если нужно сравнение(а оно и нужно) то, возможно, прокатит.

Можно попробовать такой вариант, спасибо.

Автор поста оценил этот комментарий
То есть, у Вас есть фиксированные значения переменных и вероятность выигрыша при таком сочетании?
раскрыть ветку (1)
Автор поста оценил этот комментарий

Коэффициенты a b c постоянны, а вот X Y Z разные каждую игру. + шанс выиграть, стремящийся к 50%.

Например, есть статистика по сотне игр:
1: Выигрыш, + 40 очков(N), "меткость" 45%, "урон" 1000.
2: Выигрыш: + 20 очков(N), меткость 30%, "урон" 500.

и т д...
Точно известно, что "меткость" и "урон" используются в формуле расчета N.

показать ответы
Автор поста оценил этот комментарий
Вы хотите сказать, что у Вас линейная система с пятью неизвестными. И только одно уравнение.
раскрыть ветку (1)
Автор поста оценил этот комментарий

Получается так. Но есть множество комбинаций(собранная статистика) вроде N = <что-то>, а, при этом, X, = <что-то еще>, Y = <> и т д. Т е для каждого N есть X Y Z.
Мне не нужно знать точные коэффициенты - примерного понимания вроде "X, скорее всего,  увеличивает N больше, чем это сделает Y" достаточно. Это возможно, имея только статистику?

И да, я не силен в математике, поэтому, сорри, могу объясняться не вполне понятно.

показать ответы
Автор поста оценил этот комментарий

Отношение побед к общему числу игр зависит от множество факторов, но напрямую не зависит от игрока(помимо него, исход игры зависит еще от некоторого числа человек) и находится в районе 45-55%.

Иллюстрация к комментарию
раскрыть ветку (1)
Автор поста оценил этот комментарий

Зато, раков очень ценят противники :)

Автор поста оценил этот комментарий
Вот я два раза прочитал, и не могу понять, Вы про условную вероятность пишете, или про что-то ещё? Откуда взялась модель?
раскрыть ветку (1)
Автор поста оценил этот комментарий

Вероятность, сама по себе, не при чем. Этот абзац я привел, чтобы показать, что отношения побед к поражениям в долговременной перспективе стремится к 50% независимо от игрока.
Т е сам факт того, что игрок много выигрывает или проигрывает не участвует в рассчете N. Это известно точно.

Т е, грубо говоря, N = a * Z + b * Y + с * Z + <неизвестный фактор>.
Точная формула неизвестна, но нужно, имея статистику(набор чисел для X Y Z), примерно примерно понять коэффициенты a b c. Т е, например, a > b > c. Этого достаточно.

показать ответы