Стандартное отклонение вероятности одного исхода из конечного набора

fass965

Есть набор из k возможных исходов экспериментов и требуется найти их вероятности: P_1, P_2 ... P_k. Сумма всех P_i равна единице. Я провожу N экспериментов и получаю количество выпадений для каждого исхода: n_1, n_2 ... n_k. Сумма всех n_i равна N. Соответственно вероятности я оцениваю как p_i = n_i / N. Теперь мне нужно найти стандартное отклонение для каждого p_i.
Проиллюстрировать можно, например, бросанием заряженного кубика, чтобы выяснить вероятности для каждой из сторон и их стандартные отклонения.
У меня есть ощущение, что задачка должна быть из самых элементарных и я просто забыл как такое решать. Пытаюсь найти в Сети, но практически везде предлагается искать матожидание дискретной величины (то есть по сути матожидание i) и его стандартное отклонение. Даже для кубика везде приводится такое решение, хотя понятно, что грани в кубике пронумерованы произвольным образом и смысла в вычислении матожидания для него... ну я лично не вижу. В моём случае исходы эксперимента вообще никак не упорядочены. В общем, находится вообще не то, что нужно. :(

kravecnata

n_i распределены мультиномиально со средним Np_i и дисперсией Np_i(1-p_i поэтому n_i / N имеет среднее p_i (как и требуется) и дисперсию (=квадрат стандартного отклонения) p_i(1-p_i) / N. Последнее можно было бы оценить, подставив оценку p_i, но лучше заметить, что p(1-p) всегда не больше 1/4, поэтому стандартное отклонение не превышает 1 / 2\sqrt{N}.

demiurg

Можно преположить мультиномиальное распределение и посчитать дисперсию для него. Это, надо думать, хлопотно поэтому наверное можно чем нить приблизить.
Подробнее лень думать сорри :)

fass965

Огромное спасибо!
По всей видимости, всё-таки у нас (на физфаке) это распределение не проходят и ограничиваются биномиальным. Во всяком случае для меня слово оказалось совсем ново (хотя, может, я просто очень хорошо его забыл :) ).
P.S. Не ожидал, что ночью вообще кто-то ответит, а оказалось, что ответило два человека практически одновременно. В общем, отдельное спасибо за скорость!

toxin

Небольшая поправка: p_i*(1-p_i)/N - это смещенная оценка дисперсии. Чтобы получить несмещенную оценку, нужно взять p_i*(1-p_i)/(N-1).

fass965

Спасибо. А откуда берётся минус единица?
Для n_i дисперсия p_i(1-p_i)N или так же с минус единицей p_i(1-p_iN-1) ?

griz_a

) Полиномиальное распределение тут для виду. Для каждого i мы по сути решаем отдельную задачу про биномиальное распределение.
2) Выборочная дисперсия - выборочное среднее квадратов минус квадрат выборочного среднего. Она смещенная, поскольку среднее квадратов имеет средне как EX^2, а вот квадрат среднего имеет среднее не равное (EX)^2, матожидание квадрата больше квадрата матожидания.
Однако так уж сложилось, что если взять n/(n-1) от выборочной дисперсии, то будет как раз несмещенная оценка.
3) Дисперсия биномиального конечно же np(1-p) без всяких n-1

demiurg

Просто (в смсле в пару строк) не покажешь откуда. Стандартное отклонение посчитанное из выборки — это тоже случайная величина (которая не обязана быть равна настоящей дисперсии). Оказывается она и не равна (её среднее не равно но если добавит -1, то получается ближе к делу

griz_a

Ммм, пара строк. Пусть Z - среднее н.о.р. X_1,...,X_n, W - среднее X_1^2,...,X_n^2
Нам надо показать, что E(W-Z^2) = (n-1)/n DX
EW = E(X_1^2+...+X_n^2)/n = EX^2
E(Z^2) = DZ+ (EZ)^2 = D(X_1+...X_n)/n^2 + EX_1+...+EX_n)/n)^2 = DX/n + (EX)^2.
E(W-Z^2) = EX^2 - (EX)^2 - DX/n = (n-1)/n DX
Оставить комментарий
Имя или ник:
Комментарий: