[Статистика] Распределения Стьюдента, Фишера, хи-квадрат

tatushnik77

    Есть же немало распределений для оценки доверительных интервалов для среднего, дисперсии и др.. Важно ли когда и чем пользоваться? Почему в основном используют распределения Стьюдента, Фишера и Хи-квардрат? Разве нет других распределений для тех же среднего, дисперсии и пр.?
    Из-за их популярности для определенного класса задач а также из-за относительной простоты в вычислениях, и все?
    Например, статистика для коэффициента детерминации связана с распределением Фишера следующим образом:
[math] $\left(F=(n-2)\frac{R^2}{R^2-1} \right)$ [/math]
    Отсюда можно найти доверительные интервалы для R, тем более на интервале (0, 1) ф-я
[math] $\left(\frac{R^2}{R^2-1} \right)$ [/math]
монотонная. Но можно же и непосредственно (пусть и не аналитически) найти статистику для R, верно? Чем будут отличаться найденные по ней и ч-з Фишера доверительные интервалы и будут ли?
---
поправил, спасибо

svetik5623190

Ты зачем используешь тэг code? Куда круче

Manbox

Т.к. им пофиг, какое там на самом деле распределение.

tatushnik77

Можно здесь немного поподробнее? Кому им и почему пофиг?

coma

Вот так получилось, что нередко статистики, позволяющие построить доверительный интервал для какого-то параметра, имеют распределения фишера, стьюдента или хи-квадрат. А раз они настолько "универсальны" и довольно просты, то почему бы ими не пользоваться?(для них и таблицы есть и пр.).
Насчет различий. Например можно оценить мат.ожидание нормальной случайной величины для случаев, когда известна дисперсия и когда она неизвестна. Для этого используются разные статистики с разными распределениями. Обычно, чем больше информации тем более точную оценку можно сделать, и как раз это уже заключено в том, что статистика имеет например распределение хи-квадрат, а не стьюдента.
Для того, чтоб использовать другие распределения, надо построить статистику, имеющую такое распределение и с помощью которой можно оценить нужный тебе параметр. Но в этом случае будешь получать левые распределения с неясными свойствами и значенями моментов и квантилей (которые надо будет самому считать). Но в принципе никто не запрещает, например, построить для конкретной задачи статистику с нормальным распределением и использовать её для оценки. Но вот только получится ли?

a7137928

Из-за их популярности для определенного класса задач а также из-за относительной простоты в вычислениях, и все?

Насколько я понимаю, да.
В 90% задач людям хватает нормальной гипотезы и трех формул. Они вообще не парятся, что там как распределено, и какая формула для дисперсии лучше всего ее аппроксимирует. Они считают свои фишера и хи-квадраты, и самое смешное, что часто получают вполне приличный (с точки зрения здравого смысла) результат. Иногда даже не включая мозг ни на минуту.
Если же у тебя нормальная гипотеза не выполняется, или ты что-то знаешь про распределения величин в твоей выборке, или ты просто умный и хочешь какую-нибудь более точную оценку дисперсии, чем предлагает простейшая теория, то ты можешь напридумывать более сложных и красивых формул.
Если у тебя получается более точно вычислить доверительный интервал - ну отлично. Но если тебе в твоей задаче такая точность ни к чему (а обычно так и происходит то можно забить и пользоваться обычными формулами.
Оставить комментарий
Имя или ник:
Комментарий: