[коэффициект детерминации]

tatushnik77

  Определили мы, допустим, по МНК все, что надо. Теперь надо выяснить, насколько связаны между собой величины x и y. Это делается (вроде) по коэффициенту детерминации, который связан с распределением Фишера следующим образом:
  [math] $\left(F=(n-2)\frac{R^2}{R^2-1} \right)$ [/math]
  Так вот: из здравого смысла: чем больше дисперсия у ошибок, тем он меньше должен быть. С другой стороны, эта формула не содержит в себе дисперсии.
  
  У кого какие сображения?

coma

в смысле "формула не содержит"?
правая часть выражения содержит неявно дисперсии (через определение R)
а то, что независимо от этих дисперсий правая часть распределена по фишеру - это свойство оценок по МНК

tatushnik77

Но если точки (х, у) разбросаны достаточно сильно, то это значит, что величины не коррелируют и МНК никак не объясняет никакую зависимость, так? значит,
  Так вот: из здравого смысла: чем больше дисперсия у ошибок, тем он меньше должен быть. С другой стороны, эта формула не содержит в себе дисперсии.Значит, величина
 [math] $\left(R^2 \right)$ [/math]
должна быть очень малой в практически любом интервале.
   Другими словами, у нас есть 2 выборки: одна с малой ошибкой (дисперсией а другая - с относительно большой. Это значит, что коэффициент детерминации у первой должен быть значительно ближе к единице и значительно меньше отличатся на уровне доверия, например, 99%.
   Как это следует из формулы
   [math] $\left(F=(n-2)\frac{R^2}{R^2-1} \right)$ [/math] ?
   

coma

кстати указанное выражение имеет распределение Фишера только в случае, если коэффициент корреляции равен нулю. (это я сейчас посмотрел пдф-ку, которая осталась после того, как у нас на матстате читали курс по эконометрике)
F как раз ислользуют для того, чтоб проверить гипотезу о значимости коэффициента корреляции.
Могу скинуть пдф-ку, если хочешь

tatushnik77

кстати указанное выражение имеет распределение Фишера только в случае, если коэффициент корреляции равен нулю.
А если коэффициент b (y = bx + a) лежит, например, в интервале (3, 100 с уровнем доверия 95%, то означает ли это, что y зависит от x (с уровнем доверия, наверное, не менее 95%)?
Ведь, с одной стороны, через 0 интервал (3, 100) не проходит, а с другой — сильно уж он большой.
Оставить комментарий
Имя или ник:
Комментарий: