Вероятность заражения клетки

vitalek1990

Мы заражаем клетки вирусами и видим что заражено, скажем, 60%. При этом понятно что "истинная" вероятность заражения больше - скажем из этих 60% один раз заражено 50% а два - 10% и истинная вероятность - 70%.
В общем надо узнать вероятность заражения зная % незараженных клеток. Будем считать что клеток очень много и заражение клетки в первый и последующий разы - независимые процессы. Thanks!

sashok01

Я правильно понял задачу? У нас есть N изначально пустых стаканов. В стаканы мы случайным образом кидаем M горошин (возможно, в некоторые стаканы попадет более одной горошины). В итоге осталось K пустых стаканов. Нужно как-то оценить M, зная N и K?

vitalek1990

да, именно так

ouvaroff

тогда это не комбинаторика, а статистика

griz_a

Все зависит от того, что такое оценить.
Как в треде про дни рождения уже выясняли, среднее у этого распределения
[math]$N(1-N-1)/N)^M$[/math] то есть около [math]$N(1-e^{-p})$[/math], где [math]$p$[/math] - искомая вероятность. Распределение довольно сильно к среднему прижимается, поэтому оценка
[math]$ -\ln (1-\nu $[/math] где [math]$\nu$[/math] - данная нам доля зараженных, будет относительно разумной. Если интересует, допустим, доверительный интервал, повозиться придется посильнее, разве что грубая оценка из неравенства Чебышева потянет. Порядок погрешности оттуда, по-крайней мере, можно выудить.

vitalek1990

круто, спасибо, совпадает с тем что я насимулировал в Матлабе :)
пойду почитаю еще про дни рождения.

Vlad128

Там ключевой момент — теорема и приближении биномиального распределения пуассоновским.
Если n — большое, то [math]$Bin(\lambda,\lambda/n)$[/math] хорошо приближается на [math]$\Pi (\lambda)$[/math]

vitalek1990

Должна ли быть для этого еще маленькая лямбда? Это был изначальный план - приблизить распределение пуассоновским, но потом прочел вот это вот в википедии, типа только для редких явлений
Poisson distribution is a good approximation of the binomial distribution if n is at least 20 and p is smaller than or equal to 0.05, and an excellent approximation if n ≥ 100 and np ≤ 10.[4]

Vlad128

там вроде было только про [math]$n\to \infty$[/math] и [math]$np \to \lambda$[/math], тогда слабая сходимость. Про ограничение на лямбду не помню. Может и запамятовал чего.

griz_a

О чем речь? О каком пуассоновском приближении и для чего?
Пуассоновским можно приблизить число заражений клетки. А число зараженных клеток тут причем?

griz_a

Имхо, пуассоновское распределение тут нафиг не нужно, использование его в предыдущем треде было таким - "приблизим биномиальное пуассоновским, у пуассоновского среднее такое-то, значит у суммы наших индикаторов - n на такое". Вообще мегакрутяка, использовать пуассоновское приближение чтобы посчитать матожидание биномиального :confused:

Vlad128

а, ну ты прямо из формулы мат. ожидания оценил, ок, не так понял твой ход мыслей :) Просто увидел логарифм и зажужжало :)
Оставить комментарий
Имя или ник:
Комментарий: