Как правильно считать среднее по выборке

yurijm123

Посоветуйте, как правильнее сделать - посчитать среднее арифметическое, или сначала оценить её распределение [math][res=150]  {\begin{equation*}  P(X=x_{i})=p_{i}  , а потом посчитать [math][res=150]  {\begin{equation*}  \sum\limits_{i=1}^n p_{i}x_{i}  \end{equation*}}  [/math] ?

Vlad128

как конкретно оценить распределение? Очевидно, есть такие методы, при которых ответ один и тот же будет :)

yurijm123

Величина в выборке принимает значения строго от -180 до 180. Я разбиваю диапазон на участки длиной dx и считаю для каждого диапазона, сколько значений в него попадает, потом нормирую полученные количества на общее количество значений, так получаю {pi}

griz_a

Первая оценка
[math]$ \overline{X}  = \frac{\sum_{i=1}^{n} X_i}{n}$[/math].
Вторая оценка
[math]$ T = \frac{\sum_{j=1}^{N} x_j \sum_{i=1}^{n} I_{X_i\in I_j}}{n} = \frac{\sum_{i=1}^{n} X_j}{n} + \frac{\sum_{i=1}^{n} ( X_i - \sum_{j=1}^{N} x_i I_{X_i\in I_j})}{n},$[/math]
где [math]$I_j$[/math] - интервалы разбиения, а [math]$x_i$[/math] - то, какое значение мы берем из интервала.
И вот тут мы приходим вот к чему - если мы неудачно выберем [math]$x_i$[/math], то второе слагаемое может быть достаточно большим (правда, оно всегда не больше диаметра наибольшего интервала). Иначе говоря, если [math]$x_j$[/math] не близко к матожиданию [math]$X$[/math] по отрезку [math]$I_j$[/math], а интервалов не очень много, то для всех Х попавших в [math]$I_j$[/math] у соответствующих слагаемых второй суммы будет систематический снос.
Если интервалов меньше по порядку чем [math]$\sqrt{n},$[/math] то порядок погрешности может увеличиться.
Если интервалов больше по порядку чем [math]$\sqrt{n}$[/math], то использование второго метода ничего не внесет.
Если [math]$\sqrt{n} $[/math], то может и можно подобрать параметры так, чтобы погрешность [math]$\overline{X}$[/math] компенсировалась вторым слагаемым, но это, видимо, можно сделать только зная распределение.
В целом не бросается в глаза, чем же хорош второй метод...

yurijm123

Спасибо.

zena72

граждане математики, подскажите, а как в Экселе построить такую гистограмму:
 
Я разбиваю диапазон на участки длиной dx и считаю для каждого диапазона, сколько значений в него попадает

и как вообще такая конструкция называется с точки зрения матстата? Мне помнится, что это и есть "гистограмма" (то бишь графическое отображение того, сколько значений выборки попадает в указанный интервал).

Vlad128

в гугль вбей «excel histogram»
Оставить комментарий
Имя или ник:
Комментарий: