Линейная регрессия
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
Всероссийский Заочный Финансово-Экономический институт
Филиал г. Тула
Контрольная работа
по дисциплине "Эконометрика"
Вариант 8
Выполнила:
Проверил:
Тула
2008
Задача 1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (, млн. руб.) от объема капиталовложений (, млн. руб.).
Требуется:
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
Проверить выполнение предпосылок МНК.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента
Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью -критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.
Представить графически: фактические и модельные значения точки прогноза.
Составить уравнения нелинейной регрессии:
гиперболической;
степенной;
показательной.
Привести графики построенных уравнений регрессии.
Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Вариант 8
17
22
10
7
12
21
14
7
20
3
26
27
22
19
21
26
20
15
30
13
Решение:
Уравнение линейной регрессии имеет следующий вид:
Таблица 1
№наблюдения
X
Y
X2
X·Y
1
17
26
289
442
2
22
27
484
594
3
10
22
100
220
4
7
19
49
133
5
12
21
144
252
6
21
26
441
546
7
14
20
196
280
8
7
15
49
105
9
20
30
400
600
10
3
13
9
39
Сумма
133
219
2161
3211
Ср. значение
13,3
21,9
216,1
321,1
Найдем b:
Тогда
Уравнение линейной регрессии имеет вид: ŷx =11,779+0,761x.
Коэффициент регрессии показывает среднее изменение результата с изменением фактора на одну единицу.
С увеличением объема капиталовложений на 1 млн. рублей объем выпускаемой продукции увеличится в среднем на 761 тыс. рублей.
Вычислим остатки при помощи. Получим:
Таблица 2
ВЫВОД ОСТАТКА
Наблюдение
Остатки
1
24,72
1,284
1,649
2
28,52
-1,521
2,313
3
19,39
2,611
6,817
4
17,11
1,894
3,587
5
20,91
0,089
0,008
6
27,76
-1,76
3,098
7
22,43
-2,433
5,919
8
17,11
-2,106
4,435
9
27
3,001
9,006
10
14,06
-1,062
1,128
Сумма
219
-0,003
37,961
Найдем остаточную сумму квадратов:
Дисперсия остатков равна:
.
График остатков имеет следующий вид:
График 1
Проверим выполнение предпосылок МНК.
Случайный характер остатков.
Случайный характер остатков εi проверяется по графику. Как видно из графика 1 в расположении точек εi нет направленности (на графике получена горизонтальная полоса). Следовательно, εi – случайные величины и применение МНК оправдано.
Средняя величина остатков или математическое ожидание равно нулю.
Так как расположение остатков на графике не имеет направленности (расположены на графике в виде горизонтальной полосы), то они независимы от значений фактора xi. Следовательно, модель адекватна.
Проверка гомоскедастичности остатков.
Выборка у нас малого объема, поэтому для оценки гомоскедастичность остатков используем метод Голдфельда - Квандта.
Упорядочим n = 10 наблюдений в порядке возрастания х.
Разделим на две группы - с большим и меньшим x, и для каждой группы определим уравнения регрессии.
Таблица 3
х
y
x·y
x2
ŷ
εi=yi-ŷi
ε2
1
3
13
39
9
13,181
-0,181
0,033
2
7
19
133
49
17,197
1,803
3,251
3
7
15
105
49
17,197
-2,197
4,827
4
10
22
220
100
20,209
1,791
3,208
5
12
21
252
144
22,217
-1,217
1,481
Сумма
39
90
749
351
12,799
Ср.знач
7,8
18
149,8
70,2
х
y
x·y
x2
ŷ
εi=yi-ŷi
ε2
1
14
20
280
196
21,672
-1,672
2,796
2
17
26
442
289
24,252
1,748
3,056
3
20
30
600
400
26,832
3,168
10,036
4
21
26
546
441
27,692
-1,692
2,863
5
22
27
594
484
28,552
-1,552
2,409
Сумма
94
129
2462
1810
21,159
Ср.знач
18,8
25,8
492,4
362
3) Рассчитаем остаточные суммы квадратов для каждой регрессии.
,
.
4) Вычислим F- распределения.
Fнабл=S2ŷ/S1ŷ =1,653.
5) Произведем сравнение Fнабл и Fтабл.
1,653<5,32 (при k1=1 и k2=n–2=10–2=8), следовательно, гетероскедастичность места не имеет, т.е. дисперсия остатков гомоскедастична.
Отсутствие автокорреляции.
Отсутствие автокорреляции проверяется по d-критерию Дарбина - Уотсона:
Таблица 4
εi
εi-1
εi- εi-1
(εi- εi-1)2
1
1,284
2
-1,521
1,284
-2,805
7,868
3
2,611
-1,521
4,132
17,073
4
1,894
2,611
-0,717
0,5141
5
0,089
1,894
-1,805
3,258
6
-1,760
0,089
-1,849
3,4188
7
-2,433
-1,760
-0,673
0,4529
8
-2,106
-2,433
0,327
0,1069
9
3,001
-2,106
5,107
26,081
10
-1,062
3,001
-4,063
16,508
Сумма
75,282
; d=75,282/37,961=1,983.
Так как d-критерий меньше двух, то мы наблюдаем присутствие положительной автокорреляции.
Остатки подчиняются нормальному закону распределения.
Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента
; ,
; ,
где
Тогда , ; и
tтабл=2,3060 (при 10-2=8 степенях свободы); tа и tb> tтабл, что говорит о значимости параметров модели.
Коэффициент детерминации находится по формуле:
.
Данные возьмем из таблицы 5:
Таблица 5
№
x
y
1
17
26
3,7
4,1
13,69
16,81
1,284
4,938
2
22
27
8,7
5,1
75,69
26,01
-1,521
5,633
3
10
22
-3,3
0,1
10,89
0,01
2,611
11,868
4
7
19
-6,3
-2,9
39,69
8,41
1,894
9,968
5
12
21
-1,3
-0,9
1,69
0,81
0,089
0,424
6
21
26
7,7
4,1
59,29
16,81
-1,760
6,769
7
14
20
0,7
-1,9
0,49
3,61
-2,433
12,165
8
7
15
-6,3
-6,9
39,69
47,61
-2,106
14,040
9
20
30
6,7
8,1
44,89
65,61
3,001
10,003
10
3
13
-10,3
-8,9
106,09
79,21
-1,062
8,169
Сумма
133
219
392,1
264,9
83,979
Ср. знач.
13,3
21,9
Для проверки значимости модели используем F-критерий Фишера:
.
Fтабл=5,32 (k1=1, k2=8 степенями свободы) ;
F>Fтабл, что говорит о значимости уравнения регрессии.
Среднюю относительную ошибку аппроксимации находим по формуле:
;
В среднем расчетные значения отклоняются от фактических на 8,4%.
Поскольку найденная средняя относительная ошибка аппроксимации находится в интервале от 5 до 10, то можно утверждать, что модель имеет хорошее качество.
Ширина доверительного интервала находится по формулам:
где tα=1,86 при m=n-2=8 и α=0,1
Т.о.
Верхн. граница: 25,173+4,34=29,513
Нижн. граница: 25,173-4,34=20,833
Таблица 6
Нижняя граница
Прогноз
Верхняя граница
20,83
25,17
29,51
Фактические и модельные значения Y, точки прогноза представлены на графике 2.
График 2
Составить уравнения нелинейной регрессии:
Гиперболической
Уравнение показательной кривой имеет вид: ŷ = a + b/x.
Произведем линеаризацию модели путем замены Х = 1/х.
Тогда уравнение примет вид: ŷ = a + bХ- линейное уравнение регрессии.
Данные, необходимые для нахождения параметров приведены в таблице 6
Таблица 7
№
y
x
X
X2
Xy
ŷ
εi
εi2
1
26
17
0,0588
0,0035
1,5294
24,41
1,59
2,52
6,11
2
27
22
0,0455
0,0021
1,2273
25,10
1,90
3,61
7,04
3
22
10
0,1000
0,0100
2,2000
22,29
-0,29
0,09
1,33
4
19
7
0,1429
0,0204
2,7143
20,09
-1,09
1,18
5,72
5
21
12
0,0833
0,0069
1,7500
23,15
-2,15
4,63
10,24
6
26
21
0,0476
0,0023
1,2381
24,99
1,01
1,02
3,89
7
20
14
0,0714
0,0051
1,4286
23,76
-3,76
14,16
18,82
8
15
7
0,1429
0,0204
2,1429
20,09
-5,09
25,88
33,91
9
30
20
0,0500
0,0025
1,5000
24,87
5,13
26,35
17,11
10
13
3
0,3333
0,1111
4,3333
10,28
2,72
7,38
20,90
Сумма
219
133
1,0757
0,1843
20,0638
86,82
125,07
Ср.знач.
21,9
13,3
0,1076
0,0184
2,0064
Значение параметров а и b линейной модели определим по формулам:
Уравнение регрессии будет иметь вид ŷ = 27,44 – 51,47 X.
Перейдем к исходным переменным, получим уравнение гиперболической модели:
.
График 3
Степенная
Уравнение степенной модели имеет вид: ŷ = a · xb
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg ŷ = lg a + b lg x
Обозначим Y = lg ŷ; A = lg a; X = lg x
Тогда уравнение примет вид: Y = A + bX - линейное уравнение регрессии.
Рассчитаем его параметры, используя данные таблицы 8:
Таблица 8
№
y
x
Y
X
YX
X2
ŷ
εi
εi2
26
17
1,4150
1,2304
1,7411
1,5140
24,545
1,45
2,12
5,60
27
22
1,4314
1,3424
1,9215
1,8021
27,142
-0,14
0,02
0,52
22
10
1,3424
1,0000
1,3424
1,0000
19,957
2,04
4,17
9,29
19
7
1,2788
0,8451
1,0807
0,7142
17,365
1,63
2,67
8,60
21
12
1,3222
1,0792
1,4269
1,1646
21,427
-0,43
0,18
2,04
26
21
1,4150
1,3222
1,8709
1,7483
26,654
-0,65
0,43
2,51
20
14
1,3010
1,1461
1,4911
1,3136
22,755
-2,76
7,59
13,78
15
7
1,1761
0,8451
0,9939
0,7142
17,365
-2,37
5,59
15,77
30
20
1,4771
1,3010
1,9218
1,6927
26,151
3,85
14,81
12,83
13
3
1,1139
0,4771
0,5315
0,2276
12,479
0,52
0,27
4,01
Сумма
219
133
13,2729
10,5887
14,3218
11,8913
37,86
74,94
Ср.знач.
21,9
13,3
1,3273
1,0589
1,4322
1,1891
Значение параметров А и b линейной модели определим по формулам:
Значение параметров А и b линейной модели определим по формулам:
Уравнение регрессии имеет вид: Y=0,91 + 0,39X
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
ŷ=100,91 · x0,39
ŷ =8,13 · x0,39.
График 4
Показательная
Уравнение показательной кривой имеет вид: ŷ = a · bx
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg ŷ = lg a + x lg b
Обозначим Y = lg ŷ; A = lg a; B = lg b
Тогда уравнение примет вид: Y = A + Bx - линейное уравнение регрессии.
Данные, необходимы для нахождения параметров, приведены в таблице 9.
Таблица 9
№наблюдения
y
x
Y
Yx
x2
ŷ
εi
εi2
1
26
17
1,4150
24,0545
289
24,564
1,436
2,06
5,52
2
27
22
1,4314
31,4900
484
29,600
-2,600
6,76
9,63
3
22
10
1,3424
13,4242
100
18,920
3,080
9,49
14,00
4
19
7
1,2788
8,9513
49
16,917
2,083
4,34
10,96
5
21
12
1,3222
15,8666
144
20,385
0,615
0,38
2,93
6
26
21
1,4150
29,7144
441
28,516
-2,516
6,33
9,68
7
20
14
1,3010
18,2144
196
21,964
-1,964
3,86
9,82
8
15
7
1,1761
8,2326
49
16,917
-1,917
3,68
12,78
9
30
20
1,4771
29,5424
400
27,472
2,528
6,39
8,43
10
13
3
1,1139
3,3418
9
14,573
-1,573
2,47
12,10
Сумма
219
133
13,2729
182,8324
2161
45,75
95,84
Ср.знач.
21,9
13,3
1,3273
18,2832
216,1
Значение параметров А и B линейной модели определим по формулам:
Уравнение регрессии будет иметь вид: Y = 1,115 + 0,016x.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
ŷ =101,115·(100,016)x;
ŷ =13,03·1,038x.
График 5
Для указанных моделей найти: R2 – коэффициент детерминации и средние относительные ошибки аппроксимации А.
для всех моделей = 264,9 (см. таблицу 5).
Степенная модель (см. таблицу 8):
;
;
Показательная модель (см.таблицу 9):
;
;
Гиперболическая модель (см. таблицу 7):
.
Таблица 10
Параметры
Модели
Коэффициент
детерминации R2
Средняя относительная ошибка аппроксимации А
1. Степенная
0,857
7,5
2. Показательная
0,827
9,6
3. Гиперболическая
0,672
12,5
Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов. Чем ближе R2 к 1, тем выше качество модели.
Чем выше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7% свидетельствует о хорошем качестве модели.
При сравнении гиперболической, степенной и показательной моделей по данным характеристикам мы видим, что наибольшее значение коэффициента детерминации R2 и наименьшую ошибку аппроксимации имеет степенная модель, следовательно, ее можно считать лучшей.
Задача 2
Даны две СФМ, которые заданы в виде матриц коэффициентов модели. Необходимо записать системы одновременных уравнений и проверить обе системы на идентифицируемость.
Таблица 1
№ варианта
№ уравнения
Задача 2а
Задача 2б
переменные
переменные
y1
y2
y3
x1
x2
x3
x4
y1
y2
y3
x1
x2
x3
x4
8
1
-1
b12
b13
0
a12
a13
0
-1
0
b13
a11
0
a13
a14
2
0
-1
b23
a21
a22
0
a24
b21
-1
b23
0
a22
0
a24
3
0
b32
-1
a31
a32
a33
0
b31
0
-1
a31
0
a33
a34
Решение
2а) , тогда система уравнений будет иметь вид:
Модель имеет 3 эндогенные (y1, y2, y3) и 4 экзогенные (x1, x2, x3, x4) переменные. Проверим каждое уравнение на необходимое и достаточное условие идентификации.
1 уравнение: y1= b12y2+b13y3+a12x2+a13x3;
Необходимое условие: D + 1 = H
Эндогенные переменные: y1, y2, y3; H=3
Отсутствующие экзогенные переменные: х1, х4; D=2
2+1=3 - условие необходимости выполнено.
Достаточное условие: В уравнении отсутствуют х1, х4. Построим матрицу из коэффициентов для второго и третьего уравнения:
Таблица 2
Уравнение
переменные
х1
х4
2
a21
a24
3
a31
0
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.
1-ое уравнение идентифицируемо.
2 уравнение: y2= b23 y3+a21x1+a22x2+a24x4 ;
Необходимое условие: D + 1 = H
Эндогенные переменные: y2, y3; H=2
Отсутствующие экзогенные переменные: х3; D=1
1+1=2 - условие необходимости выполнено.
Достаточное условие: В уравнении отсутствуют y1, х3. Построим матрицу из коэффициентов для первого и третьего уравнения:
Таблица 3
Уравнение
переменные
y1
х3
1
-1
a13
3
0
a33
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.
2-ое уравнение идентифицируемо.
3 уравнение: y3= b32y2+a31x1+a32x2+a33x3;
Необходимое условие: D + 1 = H
Эндогенные переменные: y2, y3; H=2
Отсутствующие экзогенные переменные: х4; D=1
1+1=2 - условие необходимости выполнено.
Достаточное условие: В уравнении отсутствуют y1, х4. Построим матрицу из коэффициентов для первого и второго уравнения:
Таблица 4
Уравнение
переменные
х1
х4
1
-1
0
2
0
a24
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.
3-е уравнение идентифицируемо.
В целом вся система уравнений является идентифицируемой.
Решение
2б) ,
Тогда система уравнений будет иметь вид:
Модель имеет 3 эндогенные (y1, y2, y3) и 4 экзогенные (x1, x2, x3, x4) переменные. Проверим каждое уравнение на необходимое и достаточное условие идентификации.
1 уравнение: y1= b13y3+a11x1+a13x3+a14x4;
Необходимое условие: D + 1 = H
Эндогенные переменные: y1, y3; H=2
Отсутствующие экзогенные переменные: х2; D=1
1+1=2 - условие необходимости выполнено.
Достаточное условие: В уравнении отсутствуют y2, х2. Построим матрицу из коэффициентов для второго и третьего уравнения:
Таблица 5
Уравнение
переменные
y2
х2
2
-1
a22
3
0
0
Найдем определитель: , следовательно, условие достаточности НЕ выполнено.
1-ое уравнение НЕидентифицируемо.
2 уравнение: y2= b11 y1+b23y3+a22x2+a24x4 ;
Необходимое условие: D + 1 = H
Эндогенные переменные: y1, y2, y3; H=3
Отсутствующие экзогенные переменные: x1, х3; D=2
2+1=3 - условие необходимости выполнено.
Достаточное условие: В уравнении отсутствуют x1, х3. Построим матрицу из коэффициентов для первого и третьего уравнения:
Таблица 6
Уравнение
переменные
x1
х3
1
a11
a13
3
a31
a33
Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.
2-ое уравнение идентифицируемо.
3 уравнение: y3= b31y2+a31x1+a33x3+a34x4;
Необходимое условие: D + 1 = H
Эндогенные переменные: y1, y3; H=2
Отсутствующие экзогенные переменные: х2; D=1
1+1=2 - условие необходимости выполнено.
Достаточное условие: В уравнении отсутствуют y1, х4. Построим матрицу из коэффициентов для первого и второго уравнения:
Таблица 7
Уравнение
переменные
y2
х2
1
0
0
2
-1
a22
Найдем определитель: , следовательно, условие достаточности НЕ выполнено
3-е уравнение НЕидентифицируемо.
В целом вся система уравнений является НЕидентифицируемой, так как первое и третье уравнение – НЕидентифицируемы.
2в) По данным, используя косвенный метод наименьших квадратов, построить структурную форму модели вида: y1=a01+b12y2+a11x1+ε1;
y2=a02+b21y1+a22x2+ε2
Таблица 8
Вариант
n
y1
y2
x1
x2
8
1
51.3
39.4
3
10
2
112.4
77.9
10
13
3
67.5
45.2
5
3
4
51.4
37.7
3
7
5
99.3
66.1
9
6
6
57.1
39.6
4
1
Решение
Структурную форму модели (СФМ) преобразуем в приведенную форму модели (ПФМ):
Для этого из второго уравнения выражаем y2 и подставляем его в первое, а из первого выражаем y1 и подставляем его во второе уравнение. Получим:
y1=δ11x1+ δ12x2+u1;
y2=δ21x1+ δ22x2+u2,
где u1 и u1 –случайные ошибки ПФМ.
Здесь
В каждом уравнение ПФМ с помощью МНК определим δ – коэффициент.
Для первого уравнения:
.
Для решения системы уравнений требуются вспомогательные расчеты, которые представлены в таблице 9, 10.
Таблица 9
n
y1
y2
x1
x2
1
51,3
39,4
3
10
2
112,4
77,9
10
13
3
67,5
45,2
5
3
4
51,4
37,7
3
7
5
99,3
66,1
9
6
6
57,1
39,6
4
1
Сумма
439
305,9
34
40
Сред. знач.
73,17
50,98
5,67
6,67
Для упрощения расчетов удобнее работать с отклонениями от средних уровней:
∆у = у - уср; ∆х = х - хср
Таблица 10
n
∆y1
∆y2
∆x1
∆x2
∆y1∆x1
∆x12
∆x1∆x2
∆y1∆x2
∆y2∆x1
∆y2∆x2
∆x22
1
-21,9
-11,6
-2,7
3,3
58,31
7,11
-8,89
-72,89
30,89
-38,61
11,11
2
39,2
26,9
4,3
6,3
170,0
18,78
27,44
248,48
116,64
170,47
40,11
3
-5,7
-5,8
-0,7
-3,7
3,78
0,44
2,44
20,78
3,86
21,21
13,44
4
-21,8
-13,3
-2,7
0,3
58,04
7,11
-0,89
-7,26
35,42
-4,43
0,11
5
26,1
15,1
3,3
-0,7
87,11
11,11
-2,22
-17,42
50,39
-10,08
0,44
6
-16,1
-11,4
-1,7
-5,7
26,78
2,78
9,44
91,04
18,97
64,51
32,11
∑
-0,2
-0,1
-0,2
-0,2
404,03
47,33
27,33
262,73
256,17
203,07
97,33
С учетом приведенных данных получим:
404,03 = 47,33δ11 + 27,33δ12
262,73 = 27,33δ11 + 97,33δ12
δ12 = 0,36;
С учетом этого первое уравнение ПФМ примет вид:
y1 = 8,33х1 + 0,36х2 + u1
Для второго уравнения определим δ – коэффициент с помощью МНК:
Для дальнейших расчетов данные берем из таблицы 9, 10. Получим:
256,17=47,33δ21+27,33δ22
203,07=27,33δ21+97,33δ22
δ22 = 0,68;
Второе уравнение ПФМ примет вид:
у2 = 5,02х1 + 0,68х2 + u2
3) Выполним переход от ПФМ к СПФМ. Для этого из последнего уравнения найдем х2:
Найденное х2 подставим в первое уравнение.
,
тогда b12=0,53; a11=5,67
Из первого уравнения ПФМ найдем х1
Подставим во второе уравнение ПФМ
,
тогда b21=0,6; a22=0,46
4) Свободные члены СФМ найдем из уравнения:
а01 = у1ср - b12у2ср - а11х1ср = 73,17 – 0,53 50,98 - 5,67 5,67 = 14,00;
а02 = у2ср - b21у1ср - а22х2ср = 50,98 - 0,6 73,17 - 0,46 6,67 = 4,00.
5) Записываем СФМ в окончательном виде:
y1=a01 + b12y2 + a11x1 + ε1;
y2=a02 + b21y1 + a22x2 + ε2.
y1 =14 + 0,53y2 + 5,67x1 + ε1;
y2 = 4 + 0,6y1 + 0,46x2 + ε2.

Нравится материал? Поддержи автора!
Ещё документы из категории экономика:
Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.
После чего кнопка «СКАЧАТЬ» станет доступной!
Кнопочки находятся чуть ниже. Спасибо!
Кнопки:
Скачать документ