Параметр тетта в распределении Вейбулла

soft-buyer


Что брать за тетта, чтобы проверять критерии серий, хи-квадрат, колмогорова-смирнова ну и тд, напр, для отсортированной посл-ти
1,266
1,309
1,329
1,339
1,448
1,479
1,498
1,504
1,527
1,535
1,551

единицу?

soft-buyer

Не, единица - это не то.
Каким образом брать тетта?

plugotarenko

обычно в подобных задачах нужно брать какую-нибудь состоятельную оценку для тетта.
Можно, например, попробовать оценку максимального правдоподобия.
На первый взгляд, интуитивно, нужно брать минимум из выборки.(возможно это и есть оценка макс. правдоподобия)

Afonya

Для оценки максимального правдоподобия там получатся несколько геморойная система уранений (вроде, даже не решаемая).
А вот взять за тетту минимум - мысль правильная. По крайней маре, по утверждениям А.Лебедева. Хотя лично у меня возникают сомнения в качестве такой оценки.
c и b тоже можно найти из некоторых уравнений (навскидку не вспомню но также соответствующим интуитивным передставлениям, а не каким-нибудь математически-грамотным оценкам типа ОМП или МНК.

plugotarenko

Если у нас практическая задача, то систему на ОМП можно решать численно. Хотя это тоже неприятно.
Минимум --- это состоятельная оценка на тетта. Но возникает вопрос о скорости сходимости, ответ на который сильно зависит от других параметров (в частности с). Кроме того, оценка минимум смещенная. Интересным представляется то, что если другие параметры считать известными, то минимум будет являтся достаточной статистикой. Поэтому оценку минимум можно улучшить домножением на коэффициент, зависящий от длины выборки.

slo14

>Минимум --- это состоятельная оценка на тетта
Не факт. Кусок введения из диплома:
...случайная величина $\widetilde{\Lambda}$ имеющая плотность $f_{\widetilde{\Lambda}}(\lambda) = f_\Lambda(\lambda-\mu)$ представляет собой сумму $\widetilde{\Lambda}=\mu+\Lambda$, где $\mu$ можно интерпретировать как \lgu фоновую\rgu{} интенсивность, общую для всех водителей. Но, однако, могут существовать водители, по вине которых происходит сколь угодно мало страховых случаев. То есть, параметр $\mu$ распределения $\widetilde{\Lambda}$ является, скорее, попыткой компенсировать недостатки распределения $\Lambda$ за счет константы. Таким образом, близость $\mu$ к нулю можно интерпретировать как показатель качества приближения наблюдаемой случайной величины величиной с распределением $\Lambda$.

Aleksey67

а можно и методом моментов воспользоваться.

plugotarenko

Не понял, причем здесь цитата.
Могу строго доказать, что при длине выборки, стремящейся к бесконечности минимум сходится к тетта по вероятности, что и означает состоятельность.
Если есть выборка длины n из распределения F(x на полупрямой от тетта до бесконечности.
Тогда легко посчитать функцию распределения минимума из выборки длины n. Она равна 1-(1-F(x^n, соответственно стремится к 0 при x<\theta, 1 при x>\theta.
получили сходимость по распределению к тетта(постоянная а значит, и по вероятности.

plugotarenko

можно, но нужно знать моменты этого распределения.

Aleksey67

они легко считаются

slo14

Цитата вот причем:
стандартом при приближении количества ДТП является пуассон-гамма распределение ("лажовость" водителей имеет гамма распределение когда пытаются использовать пуассон-смещенное гамма, есть соблазн придать смещению смысл "фона" (типа, меньше не бывает) - то, что вы пытаетесь сделать с тета. Однако сие не верно: у нас всегда существуют водители со сколь угодно малым кол-вом ДТП.

Katty-e

Дело в том, что мы не собираемся применять данное распределение к водителям, а просто проверяем какую-то гипотезу. Поскольку x>theta по определению распределения, то все в порядке.

Afonya

>Поэтому оценку минимум можно улучшить домножением на коэффициент, зависящий от длины выборки.
Лучше - еще сдвинуть. Но скорее всего, эти коэффициенты будут довольно корявыми, если вообще вычислимы.

Katty-e

Вообще все домножают, а не сдвигают. Наверное, потому, что MSE меньше.
А почему корявыми ? Судя по распределению ( почти что экспоненциальное семейство должно получиться что-то приличное.

soft-buyer

А можно поподробнее, из каких таких уравнений b и c найти можно. А то жутко неточный для b и c вероятностный калькулятор в statistica, не особо задумываясь, за тетта берёт 0.

Leta

а что такое вообще распределение Вейбулла. А то у меня в дипломе упоминается , а что это такое я не знаю.

pavelinc

Отрывок из диплома (моего):


Была еще прога, которая это реализует, но боюсь, что не сохранилась

Afonya

Пусть \\theta=0, F(x) - функция распределения с указанной выше плотностью и \xi - с.в., распределенная по этому закону.
Тогда F(b)=1-e^{-1} и E(\xi) = b*Г(1+1/c).
Поэтому, параметры b и c можно найти следующим образом:
пусть a_1,a_2,..,a_n - выборка, упорядоченная по возрастанию, из нее предварительно вычли \theta, и пусть m = [(1-e^{-1})*n+0.5] (где [] - целая часть тогда оценкой для b будет a_m*(m+1/2-(1-e^{-1})*n) + a_{m+1}*1-e^{-1})*n - m+1/2).
(впринципе, для простоты, если n велико, для оценки b можно взять a_m или a_{m+1}).
Зная b, решается уравнение (a_1+a_2+..+a_n)/(nb)=Г(1+1/с). Обратные гамма-функции должны быть во всех матпакетах.

Afonya

Вобщем-то, определение написано раньше. Применяется оно в теории надежности, как один из предельных законов для максимума n случайных величин.

soft-buyer

спа-си-бо
Оставить комментарий
Имя или ник:
Комментарий: