Модель вероятностных испытаний с неравными вероятностями

nastya07

Недавно прочитал книгу по случайным процессам, задумался насчет практического применения.
Возник вопрос, как можно составить модель вероятностных испытаний (типа Бернулли) с неравными вероятностями (подбрасывание монеты с вероятностями p и q выпадения орла и решки) для получения оценки вероятности выпадения N одинаковых событий подряд и как получить эти оценки ?
Я думаю это довольно тривиальный вопрос для разбирающихся в теории вероятностей, только никак не могу сообразить как сделать такую модель и получить распределение вероятности.
Подскажите плз, хотя бы вкратце, в каком направлении копать и можно ли получить такие результаты несложными выкладками ?

demiurg

p^N+q^N ?

nastya07

А как это получается ?
Нужен именно вывод или способ получения результата.

griz_a

Недавно прочитал книгу по случайным процессам, задумался насчет практического применения.

Случайных процессов? Применений как грязи.
Возник вопрос, как можно составить модель вероятностных испытаний (типа Бернулли) с неравными вероятностями (подбрасывание монеты с вероятностями p и q выпадения орла и решки) для получения оценки вероятности выпадения N одинаковых событий подряд и как получить эти оценки ?

N подряд из скольки испытаний?
В целом, если ставить задачу ожидания серии из N успехов за m бросков среди n испытаний, где [math] (2N-m)/m>p-q [/math], то это теория так называемых статистик Эрдеша-Реньи или Шеппа, в зависимости от конкретизации задачи. Там довольно много результатов не только для монетки,а вообще для любого случайного блуждания с экспоненциальными или более быстрыми хвостами у шага.
Гуглится начиная со слов "теорема Петрова", "статистика Эрдеша-Реньи" и т.д.

nastya07

Считается что процесс начался и продолжается достаточно долго, почти бесконечно.
Ок, сейчас посмотрю по этим теоремам.
А есть что-то специфическое именно под эту задачу - м.б. какая-то теорема и т.д.,из которой простым следствием или вычислением можно получить эти вероятности ?
Т.е. как сделать короткий и понятный вывод для именно такой задачи (считая любые доказанные теоремы и результаты из теории известными) ?

griz_a

Постарайтесь четко сформулировать задачу :confused:

nastya07

Нашел только предельную теорему Эрдеша-Реньи :
При бросании монеты n раз серия из гербов длины log2n наблюдается с вероятностью, стремящейся к 1 при п -> ∞.
Есть ли смысл в такой постановке задачи :
Есть случайный процесс как из стартового топика (p != q).
Считается что он запускается и отрабатывает M шагов.
Нужно оценить вероятности выпадений N одинаковых последовательных результатов во всей серии результатов + возможно определить их расположение или плотность (частоту) распределения по всей истории испытаний.
Т.е. нужна формула для ожидаемого числа одинаковых последовательностей длины N на всей последовательности - P_орел(N,M) и P_решка(N,M) в зависимости от числа шагов M и длины последовательности N.
Ясно, что такие последовательности будут встречаться все чаще по мере роста числа испытаний - можно ли как-то оценить скорость и частоту их появления ?

nastya07

Еще интересно насчет практического применения случайных процессов вообще.
Посоветуйте плз какие-нибудь обзорные материалы по этой теме, если есть.

lev-rechin

> Считается что процесс начался и продолжается достаточно долго, почти бесконечно
казино же вроде закрыли

demiurg

Еще интересно насчет практического применения случайных процессов вообще.
Всё в этом мире — случайные процессы!

griz_a

Есть случайный процесс как из стартового топика (p != q).
Считается что он запускается и отрабатывает M шагов.
Нужно оценить вероятности выпадений N одинаковых последовательных результатов во всей серии результатов + возможно определить их расположение или плотность (частоту) распределения по всей истории испытаний.
Я буду говорить только о предельных теоремах, потому что точные формулы там неподъемные. Получить их, конечно, можно, и достаточно нетрудно, например, по формуле включений-исключений, но там будет большая уродливая сумма.
Итак, если говорить о предельных результатах. В работе Komlos, Tusnady 60х или 70х годов решена более общая задача - что случайное блуждание на отрезке [0,n] где-то за m шагов превысит уровнь tm, где [math]$t>EX$[/math]
Формально ваша задача под их условия не подходит, у них для вашей задаче только [math]$t<1$[/math] рассматривается. Но навскидку все рассуждения в вашей же задаче получаются переложение их. Для удобства будем считать, что [math]$p>q$[/math]. Пусть [math]$A_{M,N}$[/math] - ваше событие, [math]$\tau$[/math] - момент начала первой серии из N или более элементов, [math]$\nu$[/math] - число таких серий на [0,M].
1) Если [math]$M = o(p^{-N} M,N\rightarrow\infty$[/math], то [math]$P(A_{M,N})\sim (M-N)q p^{N}$[/math].
Доказательство проводится таким образом. Рассматривается [math]$ P(A_{M,N}|\overline{A}_{M-1,N},...,\overline{A}_{N,N})$[/math] и показывается, что она, на самом деле, эквивалентна [math]$ p^N q$[/math].
Действительно, если расписать условную вероятность, то в числителе будет стоять вероятность серии из N орлов, перед ними должна быть решка (или наоборот N решек, а перед ними орел а на промежутке [math]$(0, M-N)$[/math] серий из решек и орлов быть не должно, снизу будет вероятность того, что на промежутке [math]$(0,M)$[/math] нет серий из решек и орлов. При любых [math]$M,N$[/math], растущих к бесконечности последние две вероятности эквиваленты, вот и останется только вероятность того, что было [math]$N$[/math] орлов и перед ними решка (вероятность [math]$N$[/math] решек и орла перед ними мала в силу [math]p<q[/math]).
Наша вероятность [math]$ P(A_{M,N}) = 1-P(\overline{A}_{M,N})= 1-\prod_{i=N}^{M} P(\overline{A}_{i}|\overline{A}_{i-1,N},...,\overline{A}_{1,N}) = 1-\prod_{i=N}^{M} (1-P(\overline{A}_{i}|\overline{A}_{i-1,N},...,\overline{A}_{1,N}.$ [/math]
Из прежней оценки это эквивалентно [math]$(M-N) p^N q$[/math]
2) Если [math]$M \sim C /(q p^{N} M,N\rightarrow\infty$[/math], то [math]$P(A_{M,N})\sim e^{-C}$[/math]. Иначе говоря,
[math]$ P(\tau qp^N \leq x)\rightarrow e^{-x} $[/math].
3) Если [math]$M\sim C/(qp^N  M,N\rightarrow\infty$[/math], то [math]$P(\nu = k) \sim e^{-C} C^{k}/k!$ [/math].
Если рассмотреть величины [math]$\tau_i q p^N$ [/math], где [math]$\tau_i$[/math] - iое начало серии из N орлов, то они в пределе образуют пуассоновский поток.
Конкретно такого вида теория используется в биологии при исследовании фрагментов ДНК, если не ошибаюсь. Плюс лингвистика при сравнении последовательностей, чтобы узнать насколько типичны ли для них большие совпадения.

nastya07

по формуле включений-исключений
Отлично, спасибо - это то что нужно, сейчас буду во всем этом понемногу разбираться.
А подскажите плз еще хотя бы общую схему вывода ожидаемых величин через формулу включений-исключений.
Имеется в виду комбинаторная формула включений-исключений :
P( {i=1}^n A_i ) = sum_{i} P(A_i) - sum_{i&j}P(A_i \A_j) + sum_{i&j&k}P(A_i \A_j \ A_k) + ... + (-1)^{n-1} P( {i=1}^n A_i ) ?

griz_a

Можно ввести [math]$B_{i,l}$[/math] - событие, что в момент i начинается последовательность длины l (ровно l). Тогда искомая вероятность [math]$A_{M,N}$[/math] будет равна по этой самой формуле включений-исключений
[math]$\sum_{l=N}^{M} (\sum_{i=0}^{M-l+1} P(B_{i,l}) -\sum_{i<i+l\leq j\leq M-l+1} P(B_{i,l} B_{j,l}) +.... )$[/math]
Все вероятности внутри считаются, а вот суммы будут противненькие.
Можно составить рекуррентное соотношение вида
[math]$ P(A_{M,N}) = P(A_{M-1,N})q+ P(A_{M-2,N})qp+...+P(A_{M-N,N})qp^{N-1} +p^N$[/math] и решить его с помощью, скажем, производящих функций.
Положим [math]$P(A_{M,N})=p_{M}, f(s) = \sum_{k=N}^{\infty} p_k s^k$[/math], тогда
[math]$f(s) = f(s) s q + f(s) s^2 qp+...+f(s) s^{N} q p^{N-1}+p^N s^N/(1-s)$[/math], откуда
[math]$$f(s)=\frac{(sp)^N}{(1-s1-qs-qps^2-...-qp^{N-1}s^N)},$$[/math]
а искомая [math]$P(A_{M,N})$[/math] ее коэффициент при [math]$s^M$[/math] в ряде Тейлора.

nastya07

Отлично, спасибо - это то что нужно.
Сейчас попробую разобраться во всех деталях.
Оставить комментарий
Имя или ник:
Комментарий: