[ мат стат ] вопрос по гипотезам

Axarium

зависит ли распределение тестовой статистики от нулевой гипотезы или нет?

griz_a

зависит ли распределение тестовой статистики от нулевой гипотезы или нет?
Это все равно что спросить "Зависит ли высота дерева от того, чем я ее измеряю".
Высота - не зависит, результат измерений - зависит.
Также и тут. Настоящее распределение оно какое-то есть и все тут - какие гипотезы не строй, оно не изменится.
Выбор статистики, разумеется, зависит от того, что я хочу узнать про параметр :)

Axarium

пардон, фрау,
допустим, что есть некоторая гипотеза, хотим проверить ее с помощью некоторого теста. тест - случайная величина, распределение которого нам заранее известно. затем считаем вероятности ошибок, эти вероятности условные. когда считаем вероятность ошибки 1 рода, мы ставим условием, что гипотеза верна, следует ли из этого, что тестовая статистика хоть как то зависит от гипотезы?

griz_a

тест - случайная величина, распределение которого нам заранее известно

Если оно известно, то как гипотезу-то проверять? В том-то и дело, что оно неизвестно - если оно будет похоже на одно - то мы будем склоняться к гипотезе, если другое - то к альтернативе.
Гипотеза определяет то, на что должна быть похожа статистика критерия при выполнении гипотезы. А по жизни у нас статистика одни и те же значения примет, что не предполагай.

Axarium

фрау, то есть, сначала, мы подразумеваем гипотезу, при этой гипотезе тестовая статистика должна дать некоторый результат, затем мы в тестовую статистику подставляем выборку и считаем значение статистики, затем сверяем полученный результат с тем, что получен был ранее, так?

Axarium

затем там появляются вероятность и уровень значимости, непонятно, откуда они там появляются

griz_a

Есть гипотеза А, что верно одно.
Есть альтернатива Б, что верно другое.
Мы подбираем такую статистику T, что она как-то характерно ведет себя при А. Если альтернатива Б не очень широкая, то можно искать Т такую, что она при Б себя тоже ведет характерно и не так как при А (например, простая гипотеза и простая альтернатива хорошо друг от друга отделяются если Б широкая, то, увы, как при Б она себя ведет определить не удастся (скажем, простая гипотеза и альтернатива в виде дополнения до гипотезы. Невозможно придумать T такую, что на А она будет вести себя по одному, а на всем Б - по-другому, ведь в Б есть очень близкие к А параметры).
Подобрали Т, смотрим, как она ведет себя при А. Смотрим, как она ведет себя на наших данных. Если похоже - то не отвергаем гипотезу. Если не похоже - отвергаем.
Отвергаем при этом наверняка, а принять наверняка сможем только если гипотеза Б узкая и мы четко можем отделить А и Б друг от друга.
Чтобы четко задать порог - когда отвергать, а когда не отвергать, надо иметь какой-то численный параметр - насколько точным я хочу быть. Обычно это ошибка первого рода - вероятность того, что я напрасно отвергну гипотезу. Этот параметр позволяет выбрать мне конкретное множество, при попадании Т в которое, я гипотезу отвергну

Axarium

фрау, вы бесподобны! вот мы и подошли к месту, которое мне непонятно,
попробую сформулировать на примере. допустим, что основная гипотеза - нормальное с некоторым средним и известной дисперсией,допустим, что используем выборочное среднее как тестовую статистику. выбрали некоторый уровень значимости, теперь считаем вероятность ощибки 1 рода. Эту вероятность мы считаем согласно нашей гипотезе?

griz_a

Конечно.
Ошибка первого рода - это что гипотеза верна, а мы ее отвергли. Отвергаем мы ее, когда статистика попадает в какое-то критическое множество. Значит мы должны посчитать вероятность того, что при верной основной гипотезе статистика попадает в критическое множество.

Axarium

благодарю Вас, фрау
Оставить комментарий
Имя или ник:
Комментарий: