зависимы ли пара выборок?

slogv352

скрипт для матлаба
close all
load 'MStatPair.txt'
qq=MStatPair;
for i=1:500
a(i,1)=qq(i,1);
b(i,1)=qq(i,2);
end
figure
plot(a,b,'r.')
как обосновать?

Sanych

Очевидно, что зависимы. Чтобы была хоть какая-то надежда на независимость, прямоугольник на картинке должен иметь стороны, параллельные осям. То есть, возможно, надо перейти к a+b и a-b. А там уже можно объяснять артефакты погрешностью измерений и случайными отклонениями
В общем, ответ - зависимы.
Возможное обоснование: эмпирическая вероятность того, что обе величины одновременно сильно отклоняются от своего математического ожидания (например, что обе малы существенно меньше (фактически, ноль, нет там точек в углах чем произведение эмпирических же вероятностей того, что они это сделают по отдельности.
Но это, конечно, если я правильно скрипт выполнил

slogv352


а как мне, еще пока не сведующему в понятиях зависимость/независимость/не не зависимость
до этого дойти,
в электронном виде есть какие-нибудь пособия именно по этой теме?

Sanych

Пособия по какой теме? Смотри в сторону учебников по мат.статистике (критерий проверки независимости) и теории вероятности (собственно понятие независимости).
Вообще, есть такое формальное определение: две вещественные случайные величины X и Y называются независимыми, если для любых чисел a и b выполняется
P(X<a)P(Y<b)=P(X<a и Y<b)
Где P(...) это вероятность того, что выполнено ..., которое в скобках.
В частности, отсюда следует, что для большого числа испытаний доля точек в пересечении вертикальной и горизонтальной полосы должна стремиться к произведению долей точек в этих полосах. Чего для распределения по диагональному прямоугольнику даже близко не наблюдается, а значит - независимость маловероятна

slogv352

есть две выборки:
 массивы
a=rand(1,5000);
b=rand(1,5000);
получаем их сумму и разность:
m=a+b;
n=a-b;
plot(x,y,'r.');
-по изображению на плоскости полученных m и n видно что они зависимы.
Случай 2
тоже самое что и выше только исходными выборками будут случайные числа распределенные нормально:
c=randn(1,5000);
d=randn(1,5000);
q=c+d;
f=c-d;
plot(q,f,'r.');
-на плоскости видно что q и f независимы
1) по какому критерию, смотря на изображение на плоскости, я могу сказать зависимы или нет эти пары, кроме критерия P(m<r1, n<r2)=P(m<r1)*P(n<r2)
2) почему во втором случае нормально распределенные исходные данные дали независимость полученной пары, а в первом случае я получил зависимость
как кстати распределены величины при применении обычного rand?

Sanych

) можно еще сравнивать не функции распределения, а функции плотности (если они, конечно, существуют. Если рассматривать непрерывный предел твоих распределений, то действительно - существуют). Плотность лучше тем, что она намного проще преобразуется при замене координат. Для независимых координат выполняется условие fx,y=f_1(x) f_2(y).
2)
Во-первых, можно убедиться, что для нормального распределения (которое во втором случае вид картинки от угла поворота не зависит (плотность вида k exp{- c r^2}, где r - расстояние до центра ).
А для равномерного (которое в первом случае) - картина совместного распределения получается менее симметричной, и оказывается, что при повороте на 45 градусов независимость координат пропадает.

slogv352

вощем читал я этого вандер вардена - тяжело вникаю в эту тему, да и здесь объяснения мне помогают, - как-то по простому мне надо объяснить если кто в силах это сделать,
этот вопрос мне надо четко с пониманием разложить по полкам и сдать его уж преподу наконец, по не "въезжаю" в тему
вот нпр не догоняю что ты, , здесь написал: fx,y=f_1(x) f_2(y).
спасибо
Оставить комментарий
Имя или ник:
Комментарий: