Какой посоветуете статистический тест

young072

Задача: есть две случайные величины X и Y, величины представлены выборками x_i, y_i с одинаковым числом элементов i=1:N. Гипотеза: случайные величины X и Y совпадают. Выборки независимы, дисперсия у двух выборок априори различная и распределение не является нормальным.
Гистограмма выборки x_i выглядит так как на картинке. Форма гистограммы для выборки y_i приблизительно такая же.

Условие т-теста Стьюдента о нормальности не выполнено.
Вопрос, что более правомерно в данном случае:
Левосторонний тест Стьюдента или тест Манна-Уитни для сравнение медиан?
Ввиду того что я изучала статистику довольно поверхностно, я не знаю какое влияние на статистические тесты оказывают выбросы (outliers) в распределении.
Очень интересно услышать рассуждения форумчан о сравнении выборок значительно отличающихся от нормального распределения.

demiurg

для не статиста.
а настоящего учОного!

young072

Не информативный комментарий.

a7137928

Не информативный комментарий.
Хочешь информативных комментариев - напиши нормально, чего тебе надо.
Клево, ты вставил картинку, т.е. как бы поработал над вопросом, а не просто так. Но не понятно ни хрена, к сожалению.

young072

Изменила описание задачи, но все равно не уверена что задача описана корректно.

muran

Какой Колмогоров-Смирнов по нормальному распр. для каждой выборки? Если больше 0.1, то о
Стьюденте даже и не мечтай.
Судя по гистограмме, в выборке у тебя ~ 1500 наблюдений. Уилкоксон-Манн-Уитни вполне подойдет. Ему на таких объемах в принципе пофиг на аутлаерсы, тем более на 99% уровне у тебя их, похоже, ~50, хотя хз. Вообще непараметрические критерии сила.

a7137928

Вообще непараметрические критерии сила.
Да, должны покатить непараметрические тесты. Можно сравнивать медианы или средние, брать какие-нибудь критерии для проверки гипотезы о сдвиге.
Хотя я бы начал вот с чего.
1) построить для них P-P plot и посмотреть глазами
2) Сравнить эмпирические ф.р. друг с другом при помощи колмогорова-смирнова
3) прологарифмировать значения и сравнить логарифмы получившихся с.в. с каким-нибудь известным распределением.
Третий пункт, наверное, даже можно сделать нулевым. А вдруг там выборка из логнормального распределения?

muran

А вдруг там выборка из логнормального распределения

Не, там хвост тяжелый, так видно
Оставить комментарий
Имя или ник:
Комментарий: