Табличное значение на 1% уровне значимости равно 16,26 (см. таблицу распределения Фишера - Снедекора). Фактическое значение F - статистики больше табличного на 1% уровне значимости, следовательно уравнение регрессии в целом значимо и на 5% уровне значимости.
б) Средняя ошибка аппроксимации равна (ΣА)/7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = =2,22%, что говорит о хорошей аппроксимации зависимости моделью (2,22% < 6%).
Вывод: модель получилась приемлемая (в смысле аппроксимации).
г) Коэффициент детерминации находим следующим образом:
= 0,901 или вариация x
определяет вариацию y
на 90,1%.
Проверка на соответствие условиям теоремы Гаусса - Маркова
а) По таблице №2 рассчитаем статистику Дарбина - Уотсона:
Таблица №2
i
e²
e
ei-1
(ei-ei-1)²
=16,050 : 18,38 = 0,8734.
1
6,75
2,60
-
-
2
0,02
0,15
2,598
5,996
3
0,37
-0,61
0,149
0,576
4
5,94
-2,44
-0,610
3,342
5
2,71
-1,65
-2,438
0,628
6
0,15
0,39
-1,646
4,134
7
2,43
1,56
0,388
1,373
Итого:
18,38
-
-1,559
16,050
Полученное значение попадает в область неопределённости: DW
(0,7; 1,35). Это значит, что для прояснения вопроса относительно автокорреляции остатков необходимо дальнейшее исследование ряда остатков другими методами, в которых отсутствует зона неопределённости.
б) Воспользуемся тестом
серий Бройша - Годфри:
Таблица №3
t
et
et-1
e²t-1
et·et-1
êt
(y-bx)²
1
2,598
0,149
0,022
0,387
0,074
6,371
2
0,149
-0,610
0,372
-0,091
-0,302
0,204
3
-0,610
-2,438
5,944
1,487
-1,208
0,358
4
-2,438
-1,646
2,709
4,013
-0,816
2,632
5
-1,646
0,388
0,151
-0,639
0,192
3,379
6
0,388
1,559
2,430
0,605
0,773
0,148
Итого:
-1,559
-2,598
11,628
5,763
-1,287
13,092
На основании полученных данных построим уравнение регрессии без свободного члена вида ŷ=b·x.
При этом стандартная ошибка коэффициента регрессии b
, рассчитанная по формуле:
,
,
= 1,181,
что меньше значения tтабл. =
2,57. Это означает, что автокорреляция первого уровня отсутствует.
Однако следует отметить, что и тест Дарбина - Уотсона и тест серий Бройша - Годфри применяются только для выборок достаточно большого размера[1]
, в то время как предложенная нам для анализа выборка состоит только лишь из семи значений.
в) При помощи критерия серий
проверим случайность распределения уровней ряда остатков. С 95% вероятностью распределение ряда остатков считается случайным, если одновременно выполняются два неравенства:
1)
общее число серий должно быть больше
двух, и 2)
- максимальная длина серии должна быть строго меньше
пяти.
Данные для расчётов получаем из таблицы № 4.
Таблица № 4.
Критерий серий линейная модель не проходит:
ei
ei
- ei-1
серии
Число серий = 2, Продолжительность самой длинной серии
равна 3.
2 =
= [2.079] = 2. (не выполняется),
хотя 3 < 5. Значит уровни распределены не случайно.
0,149
-2,449
+
-0,610
-0,759
+
-2,438
-1,828
+
-1,646
0,792
-
0,388
2,033
-
1,559
1,172
-
г) Соответствие ряда остатков нормальному закону распределения проверяем, используем RS-критерий:
= 2,63, где
.
Значение нашего RS-критерия для 7 наблюдений практически попадает в интервал [2,67 3,69], (для 10 наблюдений) хотя и этот критерий определён для выборок более 10 единиц.
д) При помощи теста ранговой корреляции Спирмена определяем отсутствие или наличие гетероскедастичности.
Таблица № 5.
Ранг Х
Х
I ei
I
Ранг еi
Di
D²i
Коэффициент ранговой кореляции определяется по формуле:
1
2,5
2,60
7
-6
36
2
3
0,15
4
-2
4
3
3,4
0,61
3
0
0
4
4,1
2,44
1
3
9
5
5
1,65
2
3
9
6
6,3
0,39
5
1
1
7
7
1,56
6
1
1
Так как абсолютное значение статистики коэффициента ранговой корелляции
=0,175 оказалась значительно меньше табличного значения
, то гетероскедастичность отсутствует.
Вывод: линейная модель не соответствует всем предпосылкам регрессионного анализа (условиям теоремы Гаусса-Маркова) и, хотя она пригодна для прогнозирования, но возникает вопрос о её значимости.
Доверительные интервалы для параметра b регрессии
Стандартные ошибки для параметров регрессии находим по формулам:
= 0,46,
= 2,18.
Проверим на статистическую значимость коэффициент b
модели, для чего рассчитаем t
-статистику по формуле
. Полученнаяt
-статистика равна -6,742, что по модулю больше табличного значения t =
2,57. Экономически этот параметр интерпретируется так: при изменении дохода потребителей на одну единицу объёмы продаж изменятся на -3,103 ед.
Проверим на статистическую значимость коэффициент a
модели, для чего рассчитаем t
-статистику по формуле
. Полученная t
-статистика равна 33,992, что больше табличного значения t =
2,57. Доверительный интервал параметраb
определяем по формуле:
;
s =
= 1,917,
Доверительный интервал параметраb
составляет
; или
(tтабл.
= 2.57, Δ = 2,57 · 0,4602 = 1,1827).
Проведённый анализ коэффициентов регрессии говорит о том, что параметры регрессии значимы, кроме того и уравнение регрессии в целом значимо на 1% уровне значимости (cм. выше). Это позволяет использовать построенную нами модель для получения прогнозов.
Точечный и интервальный прогнозы
Вначале находим точечный прогноз для значения х
, на 25% превышающего среднее значение
= 4,47 ( т.е. при
= 5,589),
. Тогда стандартная ошибка прогноза составит:
,
tтабл.
= 2.57, Δ = 2,57 · 2,18 = 5,604.
Интервальный прогноз для точечного прогноза при
= 5,589 (
) составит:
или .
[1]
Кристофер Доугерти. Введение в эконометрику. М.: Инфра М, 2001. С. 238.