Проверка гипотез

philnau

Сейчас знакомый спросил вопрос о проверке гипотез, но я уже не в силах ему помочь. Может кто вспомнит, из какой оперы следующая задача.
Есть выборка объема d: X1, ..., - случайные величины принимающие значения от 0 до 1. Есть два варианта:
1) все эти случайные величины распределены равномерно на [0,1]
2) Каждая из них распределена по своему, причем Pr[X1=0] + Pr[X2=0]+...+Pr[=0] = С - заранее заданная константа.
Надо различить (критическое множество) эти два случая. Лемма Неймана-Пирсона тут не катит. Нужно рассматривать что-то по хитрее. Но вот что?!

griz_a

Учитывая, что никаких требований к критическому множеству нет, предлагая руководствоваться рассудком. А он говорит следующее -
а) Включим в критическое множество все точки, у которых одна из координат 0, ибо P_0 попадания туда C - то что положено вычесть из C по формуле включения-исключения. А значит это ошибку 1 рода не изменит, а вот второго сократит.
б) Если у нас ни одна из координат не 0, то от заданного нам условия толку нет и можно считать что мы проверяем равномерность против неравномерности
Взять тогда критерий хи-квадрат или колмогорова с данным нам уровнем значимости. Можно Колмогорова вполне, когда хвостов нет и распределение непрерывно, то с ним хорошо живется.

vitalievna

1) все эти случайные величины распределены равномерно на [0,1]
равномерное распределение преобразованием координат можно привести к нормальному или только наоборот?
Критерием Колмогорова каким-нибудь.
Не судите строго :)

griz_a

Можно, а зачем это делать для критерия Колмогорова? :)

vitalievna

зять тогда критерий хи-квадрат или колмогорова с данным нам уровнем значимости.
Я не видел твоего сообщения, значит, не совсем дурак. Это радует.
Только хи-квадрат дискретный, зачем он для непрерывного случая нужен?

vitalievna

зачем не знаю, смытные ассоциации :) Просто нормальное распределение как-то "привычнее".

griz_a

Хи-квадрат можно применять хоть для какого случая, он никаких условий на ф.р. не накладывает.
По идее зачем? Ну он прикольный просто :) Нам же детали неизвестны, так задачу набросали,
Хи-квадрат гибче, его можно подстроить под представления об альтернативе, например.
Можно в него запихать область около нуля, если там все-таки не строгие выборки, а приближенные.
Но если выборка маленькая, то лучше патриотично пользоваться российскими критериями.

griz_a

Экспоненциально растягивать выборку это не лучшее дело вообще-то, выбросы могут ускакать в неведомые края. Но критерию Колмогорова-Смирнова безразлично, он как и многие российские продукты неказист, тяжеловат и не всегда удобен, но зато безмерно крепок и прочно стоит на ногах. :)
Поэтому это преобразование просто улетит в никуда, ничего не изменится кроме того, что придется кучу расчетов делать.

vitalievna

Хи-квадрат можно применять хоть для какого случая, он никаких условий на ф.р. не накладывает.
ну не совсем ведь так, он требует разбиения на интервалы и не может различить функции, которые имеют одинаковые вероятности попадания в интервал.
А колмогоров не может различить функции, сближающиеся то ли как единица на эн, то ли как единица на корень из эн. Это круче :)
Если это задачка для экзамена, то вообще непонятно. Ещё и рандомизированный критерий может понадобиться.

griz_a

 
ну не совсем ведь так, он требует разбиения на интервалы и не может различить функции, которые имеют одинаковые вероятности попадания в интервал.
А колмогоров не может различить функции, сближающиеся то ли как единица на эн, то ли как единица на корень из эн. Это круче

Интервалы-то, однако, с ростом выборки стягиваются, поэтому там тоже есть скорость сходимости. У хи-квадрат всегда есть свои плюсы - он точнее подстраивается под нужды пользователя. Например, какой-нибудь закон арксинуса с жестоким поведением у 0 и 1 Колмогоров отслеживает плохо, он наибольшим корень из n элементам выборки может давать вести себя как угодно. А хи-квадратом их можно обрубить, если представлять возможность такого случая.
Можно, правда, на хвостатые случаи использовать всякие Крамера-Мизесовые аналоги КС, но там тоже свои минусы. Поэтому я и предложил оба. Не нравится - используем первый метод, он простой и ясный как бросок кирпича в лицо. В общем, войну Пирсона и Колмогорова предлагаю прекратить, только зря тред зафлуживаем. У каждого свои плюсы.
Причины для рандомизации? Оо Непрерывное распределение, мутная альтернатива. В чем логика?
На задачу с экзамена не похожа, лишнее условие про C, например, болтается. Думаю, из жизни. Какой-нибудь прибор шкалит, к примеру, вот атом в 0 и возникает.

vitalievna

тогда все верно, снимаю шляпу.

philnau

Большое спасибо за ответ.
Товарищу это очень сильно помогло. Не скажу, что он полностью решил свою исходную задачу, но теперь по крайней мере знает как действовать.
Оставить комментарий
Имя или ник:
Комментарий: