Эконометрика
Контрольная работа
По эконометрики
Обзор корреляционного поля
Эти данные скорее всего можно аппроксимировать при помощи линейной регрессии вида ŷ = а - b·x, как самой простой.
Рассчитаем необходимые суммы и запишем их в таблице № 1:
Таблица №1:
i
x
y
x²
y²
x·y
ŷ
e
e²
A(%)
2,5
69
6,25
4761
172,5
66,40
2,60
6,75
3,76
2
3
65
9
4225
195
64,85
0,15
0,02
0,23
3
3,4
63
11,56
3969
214,2
63,61
-0,61
0,37
0,97
4
4,1
59
16,81
3481
241,9
61,44
-2,44
5,94
4,13
5
5
57
25
3249
285
58,65
-1,65
2,71
2,89
6
6,3
55
39,69
3025
346,5
54,61
0,39
0,15
0,70
7
7
54
49
2916
378
52,44
1,56
2,43
2,89
Сумма:
31,3
422
157,31
25626
1833,1
422,00
0,00
18,38
15,57
Среднее:
4,471
60,286
22,473
3660,857
261,871
-
-
-
2,22%
Ковариация между y и x рассчитывается по формуле , где , , . Дисперсия и среднее квадратическое отклонение для x и y находим по формулам:
= 2,479, = 26,490, 1,575, 5,147.
= -7,692 / 2,479 = -3,103; = 60,286 + 3,103 · 4,471 = 74,159
Получили уравнение регрессии: ŷ = 74,159 - 3,103·х (округлено до сотых).
Оцениваем качество полученной линейной модели:
а) TSS = 25624 - (31,3²) : 7 = 185,492; RSS = TSS - ESS = 185,429 - 18,38 = 176,051, где ESS = = 18,38 (в таблице №1); F - статистика = RSS · (n - m - 1) : ESS = 176,051 · ·5 :18,38 = 45,45.
Табличное значение на 1% уровне значимости равно 16,26 (см. таблицу распределения Фишера - Снедекора). Фактическое значение F - статистики больше табличного на 1% уровне значимости, следовательно уравнение регрессии в целом значимо и на 5% уровне значимости.
б) Средняя ошибка аппроксимации равна (ΣА)/7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = =2,22%, что говорит о хорошей аппроксимации зависимости моделью (2,22% < 6%).
Вывод: модель получилась приемлемая (в смысле аппроксимации).
в) Коэффициент корреляции находим по формуле: = -0,949: сильная обратная линейная зависимость.
г) Коэффициент детерминации находим следующим образом: = 0,901 или вариация x определяет вариацию y на 90,1%.
Проверка на соответствие условиям теоремы Гаусса - Маркова
а) По таблице №2 рассчитаем статистику Дарбина - Уотсона:
Таблица №2
i
e²
e
ei-1
(ei-ei-1)²
=16,050 : 18,38 = 0,8734.
1
6,75
2,60
-
-
2
0,02
0,15
2,598
5,996
3
0,37
-0,61
0,149
0,576
4
5,94
-2,44
-0,610
3,342
5
2,71
-1,65
-2,438
0,628
6
0,15
0,39
-1,646
4,134
7
2,43
1,56
0,388
1,373
Итого:
18,38
-
-1,559
16,050
Полученное значение попадает в область неопределённости: DW (0,7; 1,35). Это значит, что для прояснения вопроса относительно автокорреляции остатков необходимо дальнейшее исследование ряда остатков другими методами, в которых отсутствует зона неопределённости.
б) Воспользуемся тестом серий Бройша - Годфри:
Таблица №3
t
et
et-1
e²t-1
et·et-1
êt
(y-bx)²
1
2,598
0,149
0,022
0,387
0,074
6,371
2
0,149
-0,610
0,372
-0,091
-0,302
0,204
3
-0,610
-2,438
5,944
1,487
-1,208
0,358
4
-2,438
-1,646
2,709
4,013
-0,816
2,632
5
-1,646
0,388
0,151
-0,639
0,192
3,379
6
0,388
1,559
2,430
0,605
0,773
0,148
Итого:
-1,559
-2,598
11,628
5,763
-1,287
13,092
На основании полученных данных построим уравнение регрессии без свободного члена вида ŷ=b·x. При этом стандартная ошибка коэффициента регрессии b, рассчитанная по формуле:
,
, = 1,181,
что меньше значения t табл. =2,57. Это означает, что автокорреляция первого уровня отсутствует.
Однако следует отметить, что и тест Дарбина - Уотсона и тест серий Бройша - Годфри применяются только для выборок достаточно большого размера1, в то время как предложенная нам для анализа выборка состоит только лишь из семи значений.
в) При помощи критерия серий проверим случайность распределения уровней ряда остатков. С 95% вероятностью распределение ряда остатков считается случайным, если одновременно выполняются два неравенства:
1)
общее число серий должно быть больше двух, и 2) - максимальная длина серии должна быть строго меньше пяти.
Данные для расчётов получаем из таблицы № 4.
Таблица № 4. Критерий серий линейная модель не проходит:
ei
ei - ei-1
серии
Число серий = 2, Продолжительность самой длинной серии
равна 3.
2 = = [2.079] = 2. (не выполняется),
хотя 3 < 5. Значит уровни распределены не случайно.
0,149
-2,449
+
-0,610
-0,759
+
-2,438
-1,828
+
-1,646
0,792
-
0,388
2,033
-
1,559
1,172
-
г) Соответствие ряда остатков нормальному закону распределения проверяем, используем RS-критерий:
= 2,63, где .
Значение нашего RS-критерия для 7 наблюдений практически попадает в интервал [2,67 3,69], (для 10 наблюдений) хотя и этот критерий определён для выборок более 10 единиц.
д) При помощи теста ранговой корреляции Спирмена определяем отсутствие или наличие гетероскедастичности.
Таблица № 5.
Ранг Х
Х
I ei I
Ранг еi
Di
D²i
Коэффициент ранговой кореляции определяется по формуле:
1
2,5
2,60
7
-6
36
2
3
0,15
4
-2
4
3
3,4
0,61
3
0
0
4
4,1
2,44
1
3
9
5
5
1,65
2
3
9
6
6,3
0,39
5
1
1
7
7
1,56
6
1
1
Так как абсолютное значение статистики коэффициента ранговой корелляции =0,175 оказалась значительно меньше табличного значения , то гетероскедастичность отсутствует.
Вывод: линейная модель не соответствует всем предпосылкам регрессионного анализа (условиям теоремы Гаусса-Маркова) и, хотя она пригодна для прогнозирования, но возникает вопрос о её значимости.
Доверительные интервалы для параметра b регрессии
Стандартные ошибки для параметров регрессии находим по формулам:
= 0,46,
= 2,18.
Проверим на статистическую значимость коэффициент b модели, для чего рассчитаем t-статистику по формуле . Полученная t-статистика равна -6,742, что по модулю больше табличного значения t = 2,57. Экономически этот параметр интерпретируется так: при изменении дохода потребителей на одну единицу объёмы продаж изменятся на -3,103 ед.
Проверим на статистическую значимость коэффициент a модели, для чего рассчитаем t-статистику по формуле . Полученная t-статистика равна 33,992, что больше табличного значения t = 2,57. Доверительный интервал параметра b определяем по формуле:
;
s = = 1,917,
Доверительный интервал параметра b составляет ; или ( tтабл. = 2.57, Δ = 2,57 · 0,4602 = 1,1827).
Проведённый анализ коэффициентов регрессии говорит о том, что параметры регрессии значимы, кроме того и уравнение регрессии в целом значимо на 1% уровне значимости (cм. выше). Это позволяет использовать построенную нами модель для получения прогнозов.
Точечный и интервальный прогнозы
Вначале находим точечный прогноз для значения х, на 25% превышающего среднее значение = 4,47 ( т.е. при = 5,589), . Тогда стандартная ошибка прогноза составит:
,
tтабл. = 2.57, Δ = 2,57 · 2,18 = 5,604.
Интервальный прогноз для точечного прогноза при = 5,589 () составит: или .
1 Кристофер Доугерти. Введение в эконометрику. М.: Инфра М, 2001. С. 238.
Нравится материал? Поддержи автора!
Ещё документы из категории экономико-математическое моделирование:
Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.
После чего кнопка «СКАЧАТЬ» станет доступной!
Кнопочки находятся чуть ниже. Спасибо!
Кнопки:
Скачать документ