Excel: проверка гипотезы на линейную регрессию

philnau

Есть набор данных. Хочецо проверить гипотезу о том, что эти данные укладываются в модель простой линейной регрессии. Можно ли средствами Экселя енто сделать?
Так какие-то F-критерии используются. Предметно ничего не нагуглил, поэтому готовое ищу.

griz_a

RSS он считает, коэффициенты вычисляет, картинку рисует, чего еще хочется?

philnau

RSS он считает, коэффициенты вычисляет, картинку рисует, чего еще хочется?
H_0: (x,y) - подчиняются линейной регрессии, то есть E(y|x) = ax+b
H_1: нет нихрена никакой регрессии.
Считаем p-значение и, если оно мало, отвергаем гипотезу и пытаемся сапроксимировать данные другими кривыми. Если же р-значение мало, то только тогда мы принимаем гипотезу и начинаем вычислять коэф-ты.

griz_a

Все равно сначала надо нарисовать график и посмотреть какой тренд подходит получше, а потом уже на адекватность проверять. Это Эксель позволяет - просто точечный график допускает добавление тренда.
А что касается самого метода - подгружаешь надстройку статанализ, открываешь регрессию, получаешь ворох разных статистик, в том числе F-статистику и ее значимость.

philnau

Все-равно не понятно.
Пусть есть набор данных. Поскольку регрессию знаю абсолютно все, то для анализа этих данных предлагают ее и использовать. У меня лично возникают сомнения в правильности такой предпосылки.
Пусть R Square получился очень большим (0,97). Это есть качественный довод в пользу регресии.
Но как понять с какой вероятностью мы принимаем гипотезу об адекватности регрессии?

griz_a

Я же говорю, подгружаешь надстройку "статанализ" (Сервис-надстройки-статанализ). В сервисе появляется пункт "анализ данных". Загружаешь его, выбираешь регрессию, выбираешь какую регрессию тебе надо, получаешь целый лист всяких параметров. Там есть F статистика и ее значимость, вот она и отвечает за адекватность твоей регрессии. F-критерий для регрессии можно прочитать где хочешь, например, в каком-нибудь Ивченко, Медведеве.
И еще раз повторю - первая стадия регрессионного, корелляционного анализа или там разбиения на кластеры - посмотреть на данные, визуально если у них размерность не 50 конечно. Не хочется - можно просто на F статистику глянуть, конечно.

griz_a

Посылки про то, что регрессию знают все и потому ее надо использовать - не очень понимаю. Данные могут быть и сгущением, например.

philnau

Посылки про то, что регрессию знают все и потому ее надо использовать - не очень понимаю. Данные могут быть и сгущением, например.
Видимо, мне не удается четко обрисовать свои затруднения :(
Когда мы говорим о F-критерии, УЖЕ предполагается некая линейная модель. И проверяется гипотеза о равенстве параметров линейной модели определенным значениям (не помню точно что в экселе, либо, что параметр=0, либо что параметр = оценкам наименьших квадратов).
Меня же интересует более общий вопрос. Мне все-равно какие там получились оценки МНК и верно ли, что параметры системы равны этим оценкам. Хочется как-то ответить на вопрос, можно ли изначально вообще рассматривать линейную регрессию.

griz_a

Я говорю о критерии, связанном с адекватностью модели. Если она адекватна - то определенная статистика имеет распределение Фишера.
Конечно, на фиксированной выборке она может принять другое распределение за Фишеровское, но когда мы альтернативу не задаем, всегда можно найти другую модель, которую критерий не отличит от регрессионной.
Ну и конечно, если отвергается гипотеза о том, что параметры модели равны МНК, то модель неадекватна :)

sverum

Меня же интересует более общий вопрос. Мне все-равно какие там получились оценки МНК и верно ли, что параметры системы равны этим оценкам. Хочется как-то ответить на вопрос, можно ли изначально вообще рассматривать линейную регрессию.
А что известно про совместное распределение рассматриваемых величин?

sweettydo

Вобще лучше для начала нарисовать график и посмотреть, на что похоже, то есть нужно понять, какими базисными функциями приближать твою регрессию. Линейная регрессия - это только частный случай приближения полиномами, то есть возможно надо будет приближать параболами или, чем похуже :) Либо приближать синусами

sweettydo

а вообще, в книжке Лагутин, "Наглядная математическая статистика" по этой теме все подробно расписано
Оставить комментарий
Имя или ник:
Комментарий: