[статистика] Т критерий

PrinceSSka

есть две независимые (кажется ) выборки, в одной 825 значений в дргуой 115064. Шеф сказал что нужно показать что они (их распределения) достоверно отличаются, причем используя этот критерий.
Если не лень не могли б описать четкую последовательность действий как это делается, просто нужно достаточно срочно (потом обязательно разберусь в "идеологией" )
Извините если что, объяснил как смог...

zuzaka

нужно взять эксель, установить (если не установлен) пакет статистического анализа, зайти в Сервис-АнализДанных-ДвухвыборочныйТтест

PrinceSSka

мне сказали с таким количеством значений (116000) ексель плохо справляется

Katrine

можно попробовать MEV (он вроде должен с большими массивами справляться)

alena62

Статистика с t-тестом есть в Origin

a7137928

Можно SPSS брать.

Slawik75

мне сказали с таким количеством значений (116000) ексель плохо справляется
Сказали правду, в excel всего 65 тыс строк. (ну вроде соответствующая степень двойки). После excel вроде довольно легко переходить на Statistica. Особенно, если знаешь паскаль.
Если есть на работе замороки с лицензиями на проги, то придется пользоваться тем, что там уже стоит. Наверняка стоит access, и он точно справится, но там, наверное, придется все делать ручками.

ETrohkina

цитирую замечания по т-критерию из книжки Статистика Дж.Хилли:
 
В частности, при очень больших размерах выборок (например, если N превышает 1000) даже сравнительно небольшие различия могут быть статистически значимыми.

т.е. у тебя в стандартное отклонение распределения разностей выборок будет вкладываться в основном маленькая выборка. В итоге тебе остаётся посчитать только средние. А среднее для большой выборки можешь и в екселе посчитать, разбив данные этой выборки пополам хотя бы.
зы. если чо пояснить, пиши в приват.
Оставить комментарий
Имя или ник:
Комментарий: