Проверка истинности моделей множественной регрессии
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего профессионального образования
АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ им. И.И. ПОЛЗУНОВА
ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ РЕГИОНАЛЬНЫМ РАЗВИТИЕМ
Расчётное задание
по дисциплине: Эконометрика
Проверка истинности моделей множественной регрессии
Выполнил:
Филатов М.И.
2010
Исходные данные
Численность студентов (на 1000 человек населения)
Динамика Валового Внутреннего Продукта (в постоянных ценах)
Динамика валового накопления основного капитала (в постоянных ценах)
x1
y
x2
Россия
64
131,2
103
Австралия
50
123
169
Австрия
29
117
115
Азербайджан
22
177,3
103,4
Армения
34
184,1
263,5
Беларусь
195
164,9
162,2
Бельгия
39
115
120
Венгрия
42
139
178
Германия
28
110
102
Грузия
42
169,3
112,4
Дания
40
114
134
Италия
34
111
125
Казахстан
61
163,4
126,7
Канада
42
121
156
Киргизия
46
134,7
83,3
Китай
15
184
420
Мексика
22
122
175
Нидерланды
33
119
129
Норвегия
47
120
130
Польша
54
140
154
Республика Молдова
34
129,1
134,1
Румыния
32
115
132
Соединенное Королевство Великобритания
38
122
146
США
58
117
143
Таджикистан
21
116,4
143,5
Украина
51
122,7
122,6
Финляндия
58
130
154
Франция
36
115
129
Швеция
48
121
129
Япония
32
105
91¹
Все данные взяты за 2003 год. Данные взяты из статистического сборника Регионы России Социально-экономические показатели.
2003. Федеральная служба государственной статистики Построение модели множественной регрессии
Расчет параметров
Рассчитаем необходимые параметры:
Признак
Ср. знач.
СКО
Характеристики тесноты связи
βi
bi
Коэф-ты частной корр.
F-критерий фактический
Табличный F-критерий
y
131,77
22,74
Ryx1x2=0,5963
x1
44,9
30,41
ryx1=0,2152
0,2639
0,1973
0,0672
ryx1х2=0,3112
Fx1факт=2,8954
4,21
x2
146,19
60,57
ryx2=0,5353
0,5583
0,2097
0,2326
ryx2х1=0,5695
Fx2факт=12,95
4,21
rx1x2=-0,0872
a=92,26
rx1х2у=-0,2453
Fфакт=7,45
3,35
Уравнение регрессии в стандартизованном масштабе:
ty =2639tx1+0,5583tx2
Уравнение множественной регрессии в естественной форме:
yтеор =92,26+0,1973x1 +0,2097x2
Рассчитаем по этой формуле теоретические значения динамики ВВП и определим среднюю ошибку аппроксимации. Она равна 9,5254.
Выбор фактора, оказывающего большее влияние
1. Динамика валового накопления основного капитала оказывает большее влияние на динамику ВВП, чем численность студентов, так как
|β2|=0,5583 > |β1|=0,2639.
2. С помощью средних коэффициентов эластичности можно оценить относительную силу влияния динамики валового накопления основного капитала (х2) и числа студентов (х1) на динамику ВВП (у):
=0,0672, =0,2326,
следовательно, с увеличением валового накопления основного капитала на 1% от их среднего значения, динамика ВВП возрастает на 0,23% от своего среднего значения. А при увеличении числа студентов на 1% от своего среднего значения, динамика ВВП увеличится на 0,067% от своего среднего значения. Очевидно, что сила влияния второго фактора (динамики валового накопления основного капитала) на результативный признак (динамику ВВП) значительно больше, чем сила влияния первого фактора (числа студентов).
3.Сравнивая коэффициенты парной и частной корреляции
ryx1
0,2152
ryx2
0,5353
ryx1x2
0,3112
ryx2x1
0,5695
Коэффициенты парной и частной корреляции отличаются незначительно что говорит о слабой межфакторной связи. Связь между динамикой валового накопления основного капитала и динамикой валового внутреннего продукта (связь прямая и средне тесная) выше, чем связь между числом студентов и динамикой ВВП (связь прямая слабая).
4. По коэффициенту множественной корреляции: Rуx1x2=0,5963 можно сделать вывод, что зависимость динамики ВВП от динамики валового накопления основного капитала и числа студентов характеризуется как средне тесная, в которой 59,63% вариации результативного признака определяется вариацией учтённых в модели факторов. Прочие факторы, не включённые в модель, составляют соответственно 35,56% от общей вариации.
4. Так как F – критерий Фишера превышает табличное значение:
Fфакт=7,45 >Fтабл=3,35
то можно говорить о статистической значимости и надёжности уравнения регрессии.
5. Сравнивая частные F – критерии фактические с пороговой константой Fтабл=4,21, делаем вывод: Fх2факт=12,95 > Fтабл, следовательно статистически подтверждена целесообразность включения в модель динамики валового накопления основного капитала, после числа студентов, т.к. этот фактор оказывает большее влияние.
Построение парных моделей регрессии
Представим данные полученные при построении парных моделей в таблице:
Модель
Aср.
r (ρ)
Уравнение
Fфакт
Линейная
10,89
0,5353
у=102,38+0,201х1
11,24
Степенная
11,008
0,4934
у=38,26×х10,2481
9,01
Показательная
10,47
0,5350
у=106,53×1,001х1
11,23
Гиперболическая
12,59
0,3786
у=165,92-4546,04/х1
4,68
Определение лучшей модели
1. Недопустимую ошибку аппроксимации имеют все 4 модели, однако у показательной модели она наименьшая, это говорит о том что линейная модель лучше аппроксимирует исходные данные чем остальные модели.
2. У линейной модели теснота связи самая сильная по сравнению с другими моделями. Это говорит о том, что показательная модель лучше подходит к нашим данным.
3. Проверив гипотезу о стат. значимости и надежности, получив значения Fфакт больше табличного во всех случаях, получаем, что все 4 уравнения являются стат. значимыми и надежными. Хотя линейная модель имеет наибольшее Fфакт по сравнению с другими моделями, это говорит о большей точности линейной модели.
По двум показателям линейная модель лучше остальных, это говорит о том, что линейная модель лучше аппроксимирует исходные данные. Однако множественная модель, на мой взгляд, лучше аппроксимирует данные, чем линейная, потому что множественная модель имеет допустимую ошибку аппроксимации и большую тесноту связи.
Проверка предпосылок МНК
1.Первую предпосылку проверим путём вычисления суммы значений остатков:
x1
x2
y
x1x2
yx1
yx2
y^x
y-y^x
64
103
131,2
6592
8396,8
13513,6
126,48
4,72
50
169
123
8450
6150
20787
137,56
-14,56
29
115
117
3335
3393
13455
122,09
-5,09
22
103,4
177,3
2274,8
3900,6
18332,82
118,28
59,02
34
263,5
184,1
8959
6259,4
48510,35
154,21
29,89
195
162,2
164,9
31629
32155,5
26746,78
164,75
0,15
39
120
115
4680
4485
13800
125,11
-10,11
42
178
139
7476
5838
24742
137,87
1,13
28
102
110
2856
3080
11220
119,17
-9,17
42
112,4
169,3
4720,8
7110,6
19029,32
124,11
45,19
40
134
114
5360
4560
15276
128,25
-14,25
34
125
111
4250
3774
13875
125,18
-14,18
61
126,7
163,4
7728,7
9967,4
20702,78
130,86
32,54
42
156
121
6552
5082
18876
133,25
-12,25
46
83,3
134,7
3831,8
6196,2
11220,51
118,80
15,90
15
420
184
6300
2760
77280
183,27
0,73
22
175
122
3850
2684
21350
133,29
-11,29
33
129
119
4257
3927
15351
125,82
-6,82
47
130
120
6110
5640
15600
128,79
-8,79
54
154
140
8316
7560
21560
135,20
4,80
34
134,1
129,1
4559,4
4389,4
17312,31
127,08
2,02
32
132
115
4224
3680
15180
126,25
-11,25
38
146
122
5548
4636
17812
130,37
-8,37
58
143
117
8294
6786
16731
133,69
-16,69
21
143,5
116,4
3013,5
2444,4
16703,4
126,49
-10,09
51
122,6
122,7
6252,6
6257,7
15043,02
128,03
-5,33
58
154
130
8932
7540
20020
135,99
-5,99
36
129
115
4644
4140
14835
126,41
-11,41
48
129
121
6192
5808
15609
128,78
-7,78
32
91
105
2912
3360
9555
117,65
-12,65
сумма
0,0000
2.Случайный характер остатков. Проверим графически:
Из графика зависимости остатков εi от теоретических значений результативного признака видно, что точки распределены случайно, следовательно, εi представляют собой случайные величины и МНК оправдан.
3. Наличие гомоскедастичности. Воспользуемся методом Гольдфельда – Квандта. Число исключаемых центральных наблюдений примем равным 8. Тогда в каждой группе будет по 11 наблюдений. Результаты расчетов представим в таблице:
x1
x2
y
x1x2
yx1
yx2
y^x
y-y^x
Ai
(y-y^x)^2
46
83,3
134,7
3831,8
6196,2
11220,51
132,15
2,55
1,8961
6,52
32
91
105
2912
3360
9555
128,41
-23,41
22,2973
548,13
28
102
110
2856
3080
11220
127,98
-17,98
16,3451
323,27
64
103
131,2
6592
8396,8
13513,6
139,08
-7,88
6,0058
62,09
22
103,4
177,3
2274,8
3900,6
18332,82
126,24
51,06
28,7972
2606,87
42
112,4
169,3
4720,8
7110,6
19029,32
133,02
36,28
21,4308
1316,41
29
115
117
3335
3393
13455
129,22
-12,22
10,4468
149,40
39
120
115
4680
4485
13800
132,65
-17,65
15,3447
311,40
51
122,6
122,7
6252,6
6257,7
15043,02
136,51
-13,81
11,2549
190,71
34
125
111
4250
3774
13875
131,48
-20,48
18,4460
419,23
61
126,7
163,4
7728,7
9967,4
20702,78
139,87
23,53
14,4012
553,73
0,0000
15,1514
6487,74
x1
x2
y
x1x2
yx1
yx2
y^x
y-y^x
Ai
(y-y^x)^2
21
143,5
116,4
3013,5
2444,4
16703,4
119,32
-2,92
2,5060
8,51
38
146
122
5548
4636
17812
124,14
-2,14
1,7530
4,57
58
154
130
8932
7540
20020
131,22
-1,22
0,9407
1,50
54
154
140
8316
7560
21560
130,25
9,75
6,9625
95,01
42
156
121
6552
5082
18876
127,90
-6,90
5,7020
47,60
195
162,2
164,9
31629
32155,5
26746,78
166,75
-1,85
1,1203
3,41
50
169
123
8450
6150
20787
133,47
-10,47
8,5103
109,57
22
175
122
3850
2684
21350
128,35
-6,35
5,2041
40,31
42
178
139
7476
5838
24742
134,04
4,96
3,5697
24,62
34
263,5
184,1
8959
6259,4
48510,35
155,95
28,15
15,2883
792,18
15
420
184
6300
2760
77280
195,01
-11,01
5,9854
121,29
0,0000
5,2311
1248,57
Величина R=0,1924 (1248,57/6487,74), меньше табличного значения F-критерия, следовательно, наличие гомоскедастичности и отсутствие гетероскедастичности.
4.Отсутствие автокорреляции. Тест Дарбина–Уотсона:
x1
x2
y
y^
lу-у^l
(lу-у^l/у)*100
у-у^
ei-ei-1
(ei-ei-1)^2
(у-у^)^2
64
103
131
126,48
4,715497
3,594
-4,715
-4,7155
22,2
22,24
50
169
123
137,56
14,55865
11,836
14,559
19,27414
371,5
211,95
29
115
117
122,09
5,093094
4,353
5,093
-9,46555
89,6
25,94
22
103
177
118,28
59,02032
33,288
-59,020
-64,1134
4110,5
3483,40
34
264
184
154,21
29,88682
16,234
-29,887
29,13349
848,8
893,22
195
162
165
164,75
0,151302
0,092
-0,151
29,73552
884,2
0,02
39
120
115
125,11
10,11485
8,796
10,115
10,26615
105,4
102,31
42
178
139
137,87
1,133281
0,815
-1,133
-11,2481
126,5
1,28
28
102
110
119,17
9,170267
8,337
9,170
10,30355
106,2
84,09
42
112
169
124,11
45,18646
26,690
-45,186
-54,3567
2954,7
2041,82
40
134
114
128,25
14,24733
12,498
14,247
59,43379
3532,4
202,99
34
125
111
125,18
14,17636
12,771
14,176
-0,07097
0,0
200,97
61
127
163
130,86
32,53879
19,914
-32,539
-46,7152
2182,3
1058,77
42
156
121
133,25
12,25437
10,128
12,254
44,79316
2006,4
150,17
46
83,3
135
118,80
15,89794
11,802
-15,898
-28,1523
792,6
252,74
15
420
184
183,27
0,725914
0,395
-0,726
15,17202
230,2
0,53
22
175
122
133,29
11,29077
9,255
11,291
12,01669
144,4
127,48
33
129
119
125,82
6,817621
5,729
6,818
-4,47315
20,0
46,48
47
130
120
128,79
8,790167
7,325
8,790
1,972546
3,9
77,27
54
154
140
135,20
4,796736
3,426
-4,797
-13,5869
184,6
23,01
34
134
129
127,08
2,015804
1,561
-2,016
2,780932
7,7
4,06
32
132
115
126,25
11,24923
9,782
11,249
13,26503
176,0
126,55
38
146
122
130,37
8,368454
6,859
8,368
-2,88077
8,3
70,03
58
143
117
133,69
16,68649
14,262
16,686
8,318035
69,2
278,44
21
144
116
126,49
10,08938
8,668
10,089
-6,59711
43,5
101,80
51
123
123
128,03
5,32814
4,342
5,328
-4,76124
22,7
28,39
58
154
130
135,99
5,992662
4,610
5,993
0,664522
0,4
35,91
36
129
115
126,41
11,40967
9,921
11,410
5,417008
29,3
130,18
48
129
121
128,78
7,777864
6,428
7,778
-3,63181
13,2
60,50
32
91
105
117,65
12,65349
12,051
12,653
4,875628
23,8
160,11
19110,43
10002,65
Исходя из статистики Дарбина-Уотсона, можно сделать вывод, что автокорреляция отсутствует, так как 1,91 находится в промежутке (1,339;2,661) (d2; 4-d2). Следовательно, значения остатков распределены независимо друг от друга. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.
Таким образом, не все предпосылки выполнились, это говорит о недостаточной надежности уравнения множественной регрессии. Возможно, можно было бы и получить надежную модель, если исключить из данных страны значение динамики ВВП, которых сильно отличается от других.
Нравится материал? Поддержи автора!
Ещё документы из категории математика:
Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.
После чего кнопка «СКАЧАТЬ» станет доступной!
Кнопочки находятся чуть ниже. Спасибо!
Кнопки:
Скачать документ