Доверительный интервал

Komandor

Есть следующее задание:
A machine fills cups with margarine, and is supposed to be adjusted so that the mean content of the cups is
close to 250 grams of margarine. A random sample of 35 cups results in a mean of 241 grams per cup. A
90% confidence interval for the mean amount of margarine is constructed for this sample. Which of the
following MUST be true?
I. The confidence interval will contain 241.
II. The confidence interval will contain 250.
III. The probability that the confidence interval will contain 250 is 0.90.
Если с первыми двумя вариантами все ясно (I-подходит, II-нет то вот с третьим...
ЖДУ ВАШИ ВАРИАНТЫ. Является ли III правильным ответом?

griz_a

Задача отлично сформулирована :)
Метод построения доверительного интервала вообще не описывается, выборка тоже
Если у меня выборка из 34 по 230 и одного в 34*11+241, то тоже среднее будет 241, но вполне может быть 90% доверительный интервал, который 241 не содержит.. Конечно, в данном варианте задачи это маловероятно, но возможно же. Если не с такими числами, то с другими. Суть - один выброс, который смещает среднее, но явный выброс.
Третий пункт не очень корректен, потому что непонятно о какой вероятности идет речь.
Видимо, вероятность распределения выборки с истинным параметром, близким к 250. Тогда она конечно бы была не менее 90%, на то он и доверительный интервал, если бы не два соображения.
1 - близкий и равный всё-таки разные вещи
2 и главный - наша выборка уже не просто распределена, она теперь условная при условии среднее равно 241. А это нечто совсем другое.
Да и вообще выборка уже сгенерирована и о вероятности нет большого смысла говорить.

Komandor

Не думаю, что в текущем варианте задания стоит сильно углубляться...
Я просто хочу узнать, верно ли утверждение о том:
что если я по какой-то выборке построил доверительный интервал (с 95% то с вероятностью 95% в него попадет неизвестное мне среднее значение генеральной совокупности?

griz_a

Что такое 90% доверительный интервал?
Это случайный интервал [math]$(\theta_{1}, \theta_{2})$[/math], такой что
[math]$P_{\theta} (\theta \in (\theta_1,\theta_2=0.9$[/math] при всех [math]$\theta$[/math]
В частности и при том, которое на самом деле

Komandor

СПАСИБО

Komandor

У меня тут возник еще один вопрос.
Есть соотношение:
var(X-Y)=var(X) - 2covar(X,Y) + var(Y).
Известно, что var(X) =1, and var(Y) = 3, в каких рамках заключено var(X-Y)?
-----------------------------------------------------------------------------------------------------------

Komandor

abs(cov(X,Y<=sqrt(var(X*sqrt(var(Y
Это верно?

lenmas

Да. Неравенство Коши-Буняковского.

sverum

У меня тут возник еще один вопрос.
Есть соотношение:
var(X-Y)=var(X) - 2covar(X,Y) + var(Y).
Известно, что var(X) =1, and var(Y) = 3, в каких рамках заключено var(X-Y)?
Стандартное отклонение удобнее.
std_dev(X) = sqrt(var(X
|std_dev(X) - std_dev(Y)| <= std_dev(X - Y) <= std_dev(X) + std_dev(Y)
Равенства достигаются, соответственно, при corr(X,Y) = 1 и при corr(X,Y) = -1.

Komandor

Ну вот это задание меня снова завело в тупик:
Based on a sample of size 20 the standard 95% confidence interval (12.5, 23.5) was constructed for the
mean μ of a normal population. Which of the following are true statements?
I. The sample mean is the center of this interval.
II. [math]$P (\mu \in (12.5,23.5=0.95$[/math]
III. We are 95% confident that the population mean is in this interval.
Правильные варианты: I и III. Но почему II не подходит? И чем принципиально II отличается от III?

griz_a

- это какая-то абстракция. Вероятность слева написана, какая именно непонятно, а внутри даже никаких случайных величин нет. Есть числа только.

Komandor

""Доверительный интервал в математической статистике — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью.""
А почему вариант II нельзя интерпретировать как вероятность, с которой неизвестная величина μ расположена в найденном интервале?

griz_a

Потому что неизвестная величина мю не случайная :)
Она просто неизвестная

Vlad128

концы интервала случайны же, на самом деле не понимаю, обозначение как во втором варианте вполне имеет место, как мне кажется. Если «мю принадлежит доверительному интервалу» понимать как то, что «интервал покрывает мю», так везде пишут :confused:

Vlad128

а, ну я понял, там надо не конкретные числа писать, а типа [math]$\mathbb{P}(\mu \in [\theta_1,\theta_2]) = 0{,}95$[/math], где [math]$\theta_1 = \ldots$[/math] далее по формулам, [math]$\theta_1$ и $\theta_2$[/math] зависят от выборки. Тогда будет корректно, а конкретные числа писать нельзя, да.

Komandor

О теперь ясно :)

griz_a

Ага, нельзя реализацию и выборку путать :)

Komandor

Объясните смысл двух предложений:
In a certain college 25 percent of students are enrolled in statistics course, 38 percent are enrolled in econometrics course and 46 percent are enrolled in either statistics course or econometrics course or both. A student chosen at random from this school is enrolled in statistics course.
А именно:
1) какой смысл несет число 46%? Ведь процент студентов, которые in either statistics course or econometrics course or both должно быть 100%!
2) как, используя эти данные, расписать все варианты? (Сколько только в экономике, сколько только в статистике, сколько и там и там, т.е. пересечение)

griz_a

) Я так понимаю 54 процента занимаются чем-то еще. Лингвистикой там.
2) Кружочки порисовать :)

Komandor

Наверное так и есть, спасибо. А то я тут уж начал малясь охеревать от условия :D
Оставить комментарий
Имя или ник:
Комментарий: