оценить силу игроков после турнира (матстат и числ. методы)

luherstag

Есть несколько независимых случайных величин (десятки, может быть сотни). Каждая распределена нормально с неизвестными параметрами.
Для некоторых пар этих величин брали независимые сэмплы и сравнивали, возможно несколько раз. Результаты таких сравнений (больше или меньше) известны.
Нужно оценить параметры распределений каким-то разумным и теоретически обоснованным образом (может быть ММП, может быть ещё как-нибудь, чтобы было удобнее считать численно). Понятно, что это можно сделать только с точностью до линейного преобразования каждой связной компоненты "турнира".

Mausoleum

В жизни делают это введением системы рейтингов. В твоем случае, наверное, будет хорош рейтинг по системе Глико.

luherstag

Я слышал про них, но они решают несколько другую задачу. Во-первых, они инкрементальные, и после каждой партии обновляют только рейтинги участников (хотя на самом деле мы получаем косвенную информацию и о других игроках). Хуже того, окончательный результат зависит от порядка игр. Во-вторых, они заточены на оценку уровня людей, у которых скилл может меняться со временем, а в моей постановке этого нет.
Я надеюсь, что для конкретно этой задачи найдётся более точное решение.

luherstag

Кстати, я сообразил что формулировка не очень корректная, потому что возможных наборов параметров может быть несколько. Например, если есть две случайные величины, и известно, что первая "выиграла" десять раз, а вторая - пять, то в качестве ответа подойдёт любая пара распределений, где первое, грубо говоря, на две трети правее второго. При этом одно из них может быть узким, а другое широким. А может быть и наоборот.
А вот дополнительного условия, которое эту неоднозначность бы устранило в общем случае (в данном конкретном, чувствую, стоило бы потребовать чтобы дисперсии были одинаковыми мне в голову не приходит.

Niklz

Не факт, что постановка некорректная.
В идеальном случае, если ты набрал бесконечно много статистики (каждый из N игроков сыграл с каждым бесконечно много игр) тебе известны все [math]$N^2$[/math] вероятностей вида [math]$P(x_i > x_j i,j=1,...,N$[/math], где [math]$x_i, x_j$[/math] - реализация игровой силы игроков.
Каждая такая вероятность выражается через параметры распределений [math]$\mu_i, \mu_j, \sigma_i, \sigma_j$[/math] и в сумме таких параметров [math]$2N$[/math]. То есть ты имеешь [math]$N^2$[/math] условий на [math]$2N$[/math] параметров. Неоднозначно в двумерном случае (4 параметра, 2 условия но начиная с трех игроков всё ок! :)
Но это в идеале. А на деле у тебя наверное даже каждый с каждым не сыграет, не то что по многу раз. Функция правдоподобия у тебя будет зависеть от [math]$2N$[/math] параметров, как будет выглядеть ее максимум - хз, это зависит от вида функции [math]$P(x_i > x_j)$[/math], которую не факт, что можно в замкнутом виде выписать.
Интуиция подсказывает, что имея только разреженную статистику вида [math]$\hat x^{(k)}_i > \hat x^{(k)}_j, k=1,\dots,K$[/math], где [math]$K$[/math] - число игр, ты точно параметры не оценишь, в лучшем случае - отранжируешь игроков.
Оставить комментарий
Имя или ник:
Комментарий: