Задача по мат.статистике

nilovaj61

следующую задачу:
Перед выборами в городе было опрошено n человек. Из них k человек отдали предпочтение нынешнему мэру. На какое количество голосов может рассчитывать мэр на выборах, если всего в городе N избирателей (вычислить с доверительной вероятностью 0,95 и 0,99). (n=900, k=300, N=78000)
Знакомый попросил решить. Задача вроде бы несложная, но я уже совсем не помню мат.статистику.

a7137928

Точечная оценка количества набранных мэром голосов p - очевидно, p_0=33.3% (k/n)
Интервальные оценки на уровне \alpha -
p_0 +- s*z_\alpha,
где s=\sqrt( p_0*(1-p_0)/n ) * \sqrt(1-n/N) - дисперсия выборочного среднего,
z_\alpha - соответствующий квантиль. z_{0.95}=1.96, z_{0.99}=2.57
Вычисляя s, получим s=0.015
Итого на уровне доверия 95% будет 33.3% +- 2.97%,
на уровне доверия 99% будет 33.3% +- 3.9%

nilovaj61

Ух ты! Спасибо большое
А не мог бы ты еще, как знающий человек, объяснить, когда используют распределение Стьюдента, а когда функцию Лапласа. Просто я решила эту задачу с помощью Лапласа и получила такой же ответ. Не понимаю почему

a7137928

Ну я вообще-то тоже использовал Лапласа. Те квантили z, которые у меня присутствуют - это квантили нормального распределения.
Тот или или иной закон распределения используют в зависимости от того, как распределена исследуемая статистика. Чтобы использовать Лапласа, надо быть уверенным, что построенная нами статистика распределена нормально (ну или хотя бы асимптотически нормально). При построении доверительного интервала используется статистика
(\overline{x} - a) / \sigma ,
\overline{x} - выборочное среднее,
а - истинное среднее, которое хотим оценить,
\sigma - корень из истинной дисперсии
Если мы знаем сигму, то эта статистика распределена нормально, и мы строим с помощью нее доверительный интервал для а с помощью Лапласа. Если же мы сигму не знаем, то приходится заменять ее на корень из выборочной дисперсии s (ну и еще отнормировать соответствующим образом и тогда статистика будет распределена по Стьюденту. Естественно, при этом доверительный интервал получается "хуже" (то есть, больше чем по Лапласу, потому что мы как бы меньше знаем, но это практически незаметно на достаточно больших выборках (скажем, больше сотни).
В данном случае сигма нам известна: \sigma^2 = p(1-p). Поэтому можно применять Лапласа.

nilovaj61

Спасибо тебе огромное! Я уж думала, что никогда не смогу разобраться. Но с твоими объяснениями все становится ясным.
Ну, если ты такой добрый, можно я еще у тебя кое-что узнаю?
Никак не могу найти - что такое стационарная вероятность и стационарное математическое ожидание для марковского процесса?

dal-las

Стационарная вероятность - это, скорей всего, то же самое, что и стационарное распределение, то есть такая вероятностная мера q на множестве состояний X, что для любого (измеримого) множества A из X и любого t>0 выполнено
q(A) = \int_{X} q(dx) P(t, x, A
где P(t, x, A) - переходная функция марковского процесса (вероятность из x попасть в A за время t).
Грубо говоря, если в начальный момент времени на множестве состояний Х взять стационарное распределение и запустить марковский процесс, то в любой последующий момент времени распределение на Х останется тем же.
А стационарное мат. ожидание - это, скорей всего, усреднение по стационарной мере.

a7137928

Тыч все правильно написал. Я бы только сказал, что стационарное мат.ожидание - это мат. ожидание случайной величины, обладающей стационарным для процесса распределением.
Ты только учти, что я несколько упрощенно все писал, в надежде, что тебе нужен только комментарий, а не подробное объяснение.

nilovaj61

Всем большое спасибо за объяснения
Но все-таки мне не очень понятно, как же решить одну задачу.
Может вы бы могли мне с ней помочь?
Найти стационарные вероятности и стационарное математическое ожидание для марковского процесса N, заданного графом переходных состояний.

\lambda_{0,1,2}=1, \mu_1=1, \mu_2=2, \mu_3=3.

a7137928

Это все прекрасно, но непонятно, что это за лямбды и мю такие. Для конечной марковской цепи обычно рисуют ориентированный подписанный граф, в котором вершины изображают состояния, ребра - возможность перехода из одного состояния в другое, а подписи ребер - вероятности подобных переходов. То есть,
1) над каждым ребром написано число от нуля до единицы
2) из каждой вершины выходят какие-то ребра, сумма чисел над которыми равна единице (это означает, что хоть куда-нибудь мы из этой вершины да перейдем).
У тебя что-то совсем другое написано, я так не понимаю.

nilovaj61

Вот и я ничего не понимаю в этой задаче
Я нарисовала все как есть. Что это за лямбда и мю самой интересно. И почему не просто лямбды какие-нибудь. Надеялась, что кто-нибудь в форуме встречался с подобными задачками...

a7137928

А откуда эта задача?

nilovaj61

Бывший одноклассник, который учится в одном заборостроительном, попросил помочь решить несколько задач. Остальные все задачки на редкость легкие, эта тоже не должна быть особо замудреной.

Skorobogatyh

Лямбды и мю - это не вероятности перехода, а интенсивности. То есть вероятность перехода из 0 в 1 за малое время h равна \lambda_0*h+o(h h стремится к нулю. Задачка простая, но сейчас больше хочется спать, чем решать. Завтра, возможно, доберусь. А, может, кто раньше порешает. Tych вот хорошо объясняет

a7137928

Хм.
1) Это что, процесс с непрерывным временем?
2) Сумма вероятностей выхода из какого-либо состояния за время h меньше единицы прималых h. Если мы никуда не переходим, то мы остаемся в этом состоянии?

Skorobogatyh

) Да. В задаче так и написано "марковский процесс". Иначе было бы "цепь Маркова".
2) Конечно.

Skorobogatyh

Воспользовавшись тем, что я написал про интенсивности, составляем такое уравнение для нулевого узла:
p_0(t+h) = p_0(t)*(1-\lambda_0*h+o(h + p_1(t)*(\mu_1*h+o(h + p_2(t)*(\mu_2*h+o(h.
Далее вычтем из обеих частей p_0(t разделим на h и устремим h к нулю. Получим уравнение
p_0'(t) = -\lambda_0*p_0(t) + \mu_1*p_1(t) + \mu_2*p_2(t). Соответственно, проделывая то же самое с остальными тремя узлами, получим следующую систему уравнений:
p_0'(t) = -p_0(t) + p_1(t) + 2p_2(t)
p_1'(t) = -2p_1(t) + p_0(t)
p_2'(t) = -3p_2(t) + 3p_3(t)
p_3'(t) = -3p_3(t) + p_1(t) + p_2(t)
Эти уравнения называются уравнениями Колмогорова.
Стационарное распределение не должно зависеть от времени, соответственно, надо искать решение (p_0, p_1, p_2, p_3 не зависящее от t. При подстановке в систему получим
0 = -p_0 + p_1 + 2p_2
0 = -2p_1 + p_0
0 = -3p_2 + 3p_3
0 = -3p_3 + p_1 + p_2
Эта система решается элементарно: p_0=1/2, p_1=1/4, p_2=p_3=1/8. Это и есть стационарное распределение. Что же касается стационарного матожидания, не очень понял, что имеется в виду. Видимо, среднее значение состояния процесса. А состояние процесса - это номер узла. Поэтому матожидание будет 0*1/2 + 1*1/4 + 2*1/8 + 3*1/8 = 7/8.

nilovaj61

Супер!
Я бы сама никогда не справилась. Ни в одной книжке не могла найти ничего подобного.
Спасибо ОГРОМНОЕ за помощь!
Оставить комментарий
Имя или ник:
Комментарий: