Вопрос про последовательности.

Verochka

Допустим, 100 точек рассеяны очень близко около координаты х0=200. И лишь 2-3 точки распеделены около других координат (например, х1=3, х2=17). По какой формуле надо вычислять среднее значение координаты, но чтобы те 2 несчастные точки практически не давали вклада в это среднее значение?
Когда берешь среднестепенное n-го порядка, то с увеличением n (n>1) их вклад все более существенен. Когда же берешь среднестепенное, но только вместо n>1 пишешь 0<n<1, то с уменьшением n вообще какая-то муть получается.

NHGKU2

среднестепенное n-го порядка
А что это?

Verochka

А что это?
([a1^n+a2^n+a3^n+...+am^n]/n)^(1/n)
n можно брать как больше, так и меньше единицы.

seregaohota

то с уменьшением n вообще какая-то муть получается.

При n<1 это не является нормой (расстоянием не выполнена аксиома треугольника, поэтому и муть получается.
Это экспериментально получено? Если изначально ясно из абстрактных соображений, что результат должен быть около 200, то есть же отбраковка выбросов, ошибок эксперимента. Не проще эти сильно отклоняющиеся сразу выкинуть как ошибки? По принципу - в сумму берём только те, которые не отклоняются больше чем на delta, и число точек тогда меньше просто будет, да и всё.

Sanych

Для этого в принципе годится медиана. То есть, упорядочить значения и отбросить крайние. Можно отбрасывать все, кроме центральных одного/двух, тогда получится собственно медиана. А можно отбросить фиксированную часть значений, а от остального уже считать среднее. Последнее может лучше подходить для сформулированной задачи.
Дальнейшее обобщение состоит в том, чтобы усреднять точки с весами, зависящими от их места в упорядочении.
Другой подход: решить задачу о минимизации суммы |z-a_i| |z-a_i|^{1/m} либо |z-a_i|ln(1+|z-a_i|) (произведений от расстояния на ln или на корень из расстояния). Можно проверить, что производная монотонна, и следовательно минимум достигается в нуле производной. Что мы суммируем, это надо думать конечно. В частности, для (z^2) получается среднее арифметическое, а для |z| медиана. Может быть, можно подобрать такое выражение, чтобы z нашёлся явно, но у меня не получилось. Впрочем, получилось подобрать простое аналитическое выражение, а именно: z arctg z, то есть z=argmin \sum (z-a_i) arctg (z-a_i). В этом случае, влияние сдвига точки с N до бесконечности такое же, по порядку величины, как и влияние сдвига с 0 до 1/N.
PS. Может так быть, что науке известны методы лучше/эффективнее.
Оставить комментарий
Имя или ник:
Комментарий: