Ошибка среднего нескольких средних с ошибками

barguzin53

Есть данные исследований с средним значением(и ошибкой) по годам, нужно получить среднее общегодовое (само среднее посчитать не проблема) и его ошибку.
Вопрос по какой формуле считать ошибку среднего средних значений с их ошибками?
как считать для произведения и суммы разных средних с ошибками нашел а для среднего значения как считать непонятно =(
Да и буду признателен ссылке на источник формулы (пригодится для оформления списка литературы)

griz_a

А можно поподробнее, а то текущая версия совсем непонятно выглядит

demiurg

Правильно ли я понял:
Есть величины a1998, a1999, a2000...., которые являются средними от чего-то там (ты не знаешь или не хочешь знать чего и к ним есть ошибки.
Ты хочешь посчитать их среднее, то есть 1/N (a1998+a1999+a2000+....).

Ktitiss

Я бы предложил взять верхнюю границу возможных значений (среднее+ошибка) и нижнюю границу (среднее - ошибка). И посчитать для них, то что тебе нужно.
Потом ошибка = (верх-низ)/2
среднее = низ+ошибка

barguzin53

А можно поподробнее, а то текущая версия совсем непонятно выглядит
Есть данные по семенной продуктивности растения за определенный период лет





год_____2004___2005___2006___2007___2008___2009___2010___2011___2012___Среднее
среднее_13,22__10,05__17,66___42,05____23_____1,9___36,25__11,69____3,31____17,68
ошибка__1,91___0,88___1,11____3,78____2,91____0,67___2,83___0,81____0,45_____?
N________36____100____48_____19_____20______20_____20____100_____70


В каждом году количество опробованных растений было различно (от 20 до 100, это зависело от продуктивности сообществ). В итоге необходимо посчитать среднее количество семян на растение (среднее за все года наблюдений) ну и соответственно представить ошибку среднего.
Идеальным был бы вариант все значения за все года свести в одну таблицу и посчитать среднее и ошибку, но часть данных была утеряна. остались только значение среднее и ошибка и количество замеров в год.

toxin

Судя по твоему результату, тебе нужно среднее по годам. Тогда ошибка - это корень из среднего квадрата ошибки.
\sqrt{(1.91^2+0.88^2+1.11^2+3.78^2+2.91^2+0.67^2+2.83^2+0.81^2+0.45^2)/9}

dimcom

В среднем будет 18±13. Ошибки каждого года тут учитывать не надо. Дополнительное пояснение требуется?

dimcom

Это с хуя ли?
UPD: Перефразируем. То есть, если погрешность каждго измерения будет 0, то общегодовая погрешность будет тоже 0, несмотря на то, что год от года средние скачут, как колхозники под спидами?

griz_a

Пусть [math]$n$[/math], [math]$N$[/math], [math]$X_i$[/math], [math]$S_i$[/math], [math]$N_i$[/math] - число лет, число растений, средние по годам, ошибки по годам, число растений по годам. Мы ищем [math]$\overline{X}$[/math] , [math]$S$[/math] - среднее и ошибку по всем наблюдениям
Тогда
[math]$\overline{X}$[/math] будет считаться как сумма всех N_i*X_i, деленная на N.
Тут была лажа. Правильно так
Считаем [math]$S$[/math] следующим образом.
Складываем все S_i^2 N_i, S_i^2 - это квадрат i-ой ошибки.
Добавляем к ним все N_i*([math]$X_i$[/math] [math]$-$[/math] [math]$\overline{X}$[/math])^2.
Результат делим на N, извлекаем корень

dimcom

Ну пиздец. Я уже опровержение начал было писать, да зашел в процессе еще раз глянуть на данные :)
Да, твоя формула, похоже, кошернее. Но для случая автора (высокая точность среднегодовых, но сильный разброс между годами) и моя сгодится.

barguzin53

Судя по твоему результату, тебе нужно среднее по годам. Тогда ошибка - это корень из среднего квадрата ошибки.
\sqrt{(1.91^2+0.88^2+1.11^2+3.78^2+2.91^2+0.67^2+2.83^2+0.81^2+0.45^2)/9}

А ссылку на источник формулы можно?
В среднем будет 18±13. Ошибки каждого года тут учитывать не надо. Дополнительное пояснение требуется?
Почему не следует учитывать ошибки каждого года? Пояснение требуется как и ссылка на то откуда информация что не надо.
Пусть , , , , - число лет, число растений, средние по годам, ошибки по годам, число растений по годам. Мы ищем , - среднее и ошибку по всем наблюдениям
Тогда
X будет считаться как сумма всех N_i*X_i, деленная на N.
S как корень из суммы N_i S_i^2, деленной на N. S_i^2 - это квадрат i-ой ошибки
В формуле это умножение N_i *S_i^2 ?
Исходя из формулы средние по годам мы считаем с учетом опробованных растений в год, а если такие данные отсутствуют (есть пара видов где есть данные только по среднему и ошибке). Да и можно тоже ссылку на первоисточник, а то стараюсь самостоятельно вникнуть в суть..
Да и чем плоха первая формула по отношению к корень из среднего квадрата ошибки? (понятно что здесь еще и учитывается количество растений опробованных за год)

dimcom

Почему не следует учитывать ошибки каждого года?

Строго говоря, их учитывать надо. Но в твоем случае они значительно меньше колебаний величины от года к году, поэтому можно на них забить.

griz_a

Да и можно тоже ссылку на первоисточник, а то стараюсь самостоятельно вникнуть в суть..

Первоисточник - правило Гюйгенса-Штейнера :)
Да и чем плоха первая формула по отношению к корень из среднего квадрата ошибки? (понятно что здесь еще и учитывается количество растений опробованных за год)

Тем, что она неверна :) Скажем, если все данные по 1 штуке разбить, то по ней 0 получится. Я даже не знаю, с чего я решил такую фигню написать оО

griz_a

Вспомнил, где что-то такое должно выводиться.
Лагутин М.Б., Наглядная математическая статистика, издание 2ое, 2008 год.
Глава 16, "Несколько независимых выборок", параграф 2, страница 244, Замечание 1.

dimcom

Да и чем плоха первая формула по отношению к корень из среднего квадрата ошибки?
Она плоха тем, что не учитывает колебаний величины от года к году. Моя формула плоха тем, что не учитывает колебаний величины от растения к растению в рамках года, но из-за малости этих колебаний в твоем случае, ее можно применять. Формула от [user=
] универсальна, но в твоем случае усложнение подсчета не сильно улучшит качество оценки.

griz_a

По приведенным данным общее среднее будет средним по больнице, ничего не отражающим

dimcom

Я про «первую», которая первая в ответе, т. е. \sqrt{(1.91... )}.

dimcom

А вот в этом месте надо уже спрашивать автора, зачем ему это среднее. Оно-то как раз отражает мат. ожидание количества семян в наугад взятом растении в наугад взятом году. Все, как раз, логично. Судя по данным, качество этих семян и условия в рамках года не сильно различались между растениями: семена одинаковые, дождиков столько же, солнце на всех одинаково светит, удобрения одной марки, агроном один и тот же и похмеляется Охотой одной и той же мануфактуры в одно и то же время по утрам. Но каждый год и агроном меняется, и Охоту бодяжат по-разному, и солнышко светит то чаще, то реже. Поэтому и разброс такой. Следовательно, среднее по больнице — это ожидаемое количество семян в следующем году при неизвестных внешних факторах. От 5 до 31.

griz_a

Это одно и то же :)

icevoin

а, да, все так

barguzin53


Спасибо за формулу. действительно универсальная, Подошла для таблицы в экселе даже для данных за 1-2 года =)
Оставить комментарий
Имя или ник:
Комментарий: