Как правильно усреднить несколько наборов данных

alexshamina

Есть несколько наборов экспериментальных точек, описывающих одну и ту же зависимость. Как их правильно усреднить? Брать среднее арифмитическое?

griz_a

Если я правильно понял, то есть несколько наборов данных, в каждом из них какое-то количество данных.
Что нам надо? Надо получить одну оценку среднего? Или несколько данных, но меньше

alexshamina

имеем: x1, x2, ... x1000, где x номер экспериментальной точки.
в каждой точке несколько раз измерено значение некой непрерывной функции. из этих значений надо получить одну функцию, которая усреднит результаты измерений. вот коряво объяснил, конечно.

griz_a

А! Это регрессионный метод. Для использования регрессионных методов надо сперва определить класс, в котором лежит эта функция. Скажем, многочлен не выше какой-нибудь степени или экспоненциальная модель или еще какая. Их надо уметь выбирать.
Потом используются оценки параметров этой функции методом МНК. Про это можно прочитать, скажем, в книге Лагутина М.Б. "Наглядная математическая статистика" или в многих других книгах по статистике, или я могу подсказать

alexshamina

да, нет тут совсем другое.
блин, не соображу как объяснить.
итак по порядку.
была картинка. её оцифровали. и эту процедуру повторили несколько раз чтобы не было артефактов при оцифровке. вот теперь надо эти данные усреднить
всё гораздо проще.

griz_a

Т.е. тебе надо в каждой точке получить наиболее разумное значение по имеющимся, а вместе они образуют что-то сложное, возможно "разрывное"?

alexshamina

именно, наиболее разумное. ты меня правильно понял, а затем сгладить эти точки каким-нибудь полиномом.
образуют они кривую, хоть и весьма причудливой формы.

griz_a

Если сглаживать полиномом, то лучше его строить до усреднения.
А если все-таки хочется сначала усреднить, то, наверное, медианой, она менее устойчива к глюкам.

alexshamina

подскажи алгоритм действий в ориджине, плиз

griz_a

Я не знаю, что такое ориджин.
И какой тебе нужен алгоритм. Если полином по неусредненным данным, то надо решить задачу оптимизации на sum(P(x_i)-y_i)^2 или использовать методы типа - найти коэффициенты многочлена как медиану дискретных производных в нуле, построенных по разным точкам.
Если по усредненным, то сперва считаешь медиану, а потом подгоняешь полином обычным МНК

alexshamina

ок. спасибо. попробую

sashachist

как вариант:
для каждой точки sumX(i)=sumX(i-1)*(i-1)/i+ X(i)/i
sumX(n) - среднее n точек
Оставить комментарий
Имя или ник:
Комментарий: