Вопросы по статистической обработке данных

vitamin23

) Как проверить выборки на нормальность распределения, если их объём <= 10? можно ли вообще определить нормальность при таком объеме или сразу пользоваться непараметрическими методами?
2) По какому тесту в программе статистика сравнивать независимые выборки объемов порядка 6-10?
3) Как понять, достаточно ли объёма 10 для стат. обработки данных или нужно довести объем выборок до 15 или 20?
P.S. Не могу найти в инете толковых ответов на эти вопросы.Посоветуйте, пожалуйста, литературу на тему этих вопросов.

Niklz

Есть куча тестов http://en.wikipedia.org/wiki/Normality_tests , но при выборке <=10 у тебя статзначимость тестов будет скорее всего невысокая, смотри конкретные тесты.
Для непараметрических методов обычно надо больше данных, чем для параметрических. Так что, при выборках меньше 10, мне кажется, единственное спасение - это предполагать какой-то параметрический вид модели.
2. Хз, никогда не пользовался. A что значит сравнивать? По цвету?
3. Требуемый размер выборки зависит от конкретной задачи, определять можно по стат.значимости результатов - грубо говоря, вероятности того, что закономерность, которую ты нашел, получилась случайно. Обычно ты в конкретной задаче можешь посмотреть, сколько требуется данных, чтобы получилась стат.значимость которая тебя удовлетворяет.

griz_a

Из нормальной выборки в 10 элементов путем нехитрой нормировки можно получить 8 независимых стьюдентовских величин.
Возьмем какое-нибудь j между 1 и n. Кладем [math]$U_j= \frac1{n+\sqrt{n}}\sum\limits_{i=1}^{n} X_i - \frac1{n+\sqrt{n}} X_j$[/math]
[math]  $Y_i=X_i - Y_j,\ i<j,\ Y_i=X_{i+1}-Y_j,\ j\leq i\leq n-1 $ [/math]
Полагаем
[math]  $S_k=\frac1{n-k-1} \sum_{k+1}^{n-1} Y_i^2 $, [/math]
[math]  $Z_k = Y_k/\sqrt{S_k}, k\leq n-2$ [/math]
Теперь [math]$ Z_k$ [/math] - набор независимых величин, где [math]$Z_k$[/math] распределено по Стьюденту с n-k-1 степенями свободы. Методом обратной функции их можно привести к равномерным на [0,1] случайным величинам в количестве 8 штук.
Тут уж можно Колмогоровым-Смирновым, Крамером-Мизесом или чем угодно подобным, смотря где отклонения нам важнее уловить. Главное, не пользоваться предельной теоремой К-С, а пользоваться тем, что предельный вид не зависит от распределения и брать по таблице распределение [math] $K_8$[/math].

vitamin23

) Имелось в виду сравнение средних двух выборок. Т.е. есть ли достоверные различия средних двух независимых выборок.

faf5083

2) Имелось в виду сравнение средних двух выборок. Т.е. есть ли достоверные различия средних двух независимых выборок.
при таком объёме выборок лучше всего перестановочные критерии. с нормальностью, на мой взгляд, не стоит возиться.
Оставить комментарий
Имя или ник:
Комментарий: