Линейная регрессия

Министерство образования и науки Российской Федерации

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования


Всероссийский Заочный Финансово-Экономический институт

Филиал г. Тула






Контрольная работа

по дисциплине "Эконометрика"

Вариант 8





Выполнила:

Проверил:






Тула

2008

Задача 1


По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (, млн. руб.) от объема капиталовложений (, млн. руб.).

Требуется:

  1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.

  2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.

  3. Проверить выполнение предпосылок МНК.

  4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента

  5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью -критерия Фишера , найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

  6. Осуществить прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора Х составит 80% от его максимального значения.

  7. Представить графически: фактические и модельные значения точки прогноза.

  8. Составить уравнения нелинейной регрессии:

  • гиперболической;

  • степенной;

  • показательной.

Привести графики построенных уравнений регрессии.

  1. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.


Вариант 8


17

22

10

7

12

21

14

7

20

3


26

27

22

19

21

26

20

15

30

13


Решение:

  1. Уравнение линейной регрессии имеет следующий вид:




Таблица 1

наблюдения

X

Y

X2

X·Y

1

17

26

289

442

2

22

27

484

594

3

10

22

100

220

4

7

19

49

133

5

12

21

144

252

6

21

26

441

546

7

14

20

196

280

8

7

15

49

105

9

20

30

400

600

10

3

13

9

39

Сумма

133

219

2161

3211

Ср. значение

13,3

21,9

216,1

321,1


Найдем b:



Тогда

Уравнение линейной регрессии имеет вид: ŷx =11,779+0,761x.

Коэффициент регрессии показывает среднее изменение результата с изменением фактора на одну единицу.

С увеличением объема капиталовложений на 1 млн. рублей объем выпускаемой продукции увеличится в среднем на 761 тыс. рублей.

  1. Вычислим остатки при помощи. Получим:


Таблица 2

ВЫВОД ОСТАТКА

Наблюдение


Остатки


1


24,72

1,284

1,649

2

28,52

-1,521

2,313

3

19,39

2,611

6,817

4

17,11

1,894

3,587

5

20,91

0,089

0,008

6

27,76

-1,76

3,098

7

22,43

-2,433

5,919

8

17,11

-2,106

4,435

9

27

3,001

9,006

10

14,06

-1,062

1,128

Сумма

219

-0,003

37,961


Найдем остаточную сумму квадратов:



Дисперсия остатков равна:


.


График остатков имеет следующий вид:


График 1



  1. Проверим выполнение предпосылок МНК.

  • Случайный характер остатков.

Случайный характер остатков εi проверяется по графику. Как видно из графика 1 в расположении точек εi нет направленности (на графике получена горизонтальная полоса). Следовательно, εi – случайные величины и применение МНК оправдано.

  • Средняя величина остатков или математическое ожидание равно нулю.

Так как расположение остатков на графике не имеет направленности (расположены на графике в виде горизонтальной полосы), то они независимы от значений фактора xi. Следовательно, модель адекватна.

  • Проверка гомоскедастичности остатков.

Выборка у нас малого объема, поэтому для оценки гомоскедастичность остатков используем метод Голдфельда - Квандта.

      1. Упорядочим n = 10 наблюдений в порядке возрастания х.

      2. Разделим на две группы - с большим и меньшим x, и для каждой группы определим уравнения регрессии.


Таблица 3


х

y

x·y

x2

ŷ

εi=yii

ε2

1

3

13

39

9

13,181

-0,181

0,033

2

7

19

133

49

17,197

1,803

3,251

3

7

15

105

49

17,197

-2,197

4,827

4

10

22

220

100

20,209

1,791

3,208

5

12

21

252

144

22,217

-1,217

1,481

Сумма

39

90

749

351



12,799

Ср.знач

7,8

18

149,8

70,2





х

y

x·y

x2

ŷ

εi=yii

ε2

1

14

20

280

196

21,672

-1,672

2,796

2

17

26

442

289

24,252

1,748

3,056

3

20

30

600

400

26,832

3,168

10,036

4

21

26

546

441

27,692

-1,692

2,863

5

22

27

594

484

28,552

-1,552

2,409

Сумма

94

129

2462

1810

 

 

21,159

Ср.знач

18,8

25,8

492,4

362
















3) Рассчитаем остаточные суммы квадратов для каждой регрессии.


,


.


4) Вычислим F- распределения.


Fнабл=S/S =1,653.

5) Произведем сравнение Fнабл и Fтабл.

1,653<5,32 (при k1=1 и k2=n–2=10–2=8), следовательно, гетероскедастичность места не имеет, т.е. дисперсия остатков гомоскедастична.

  • Отсутствие автокорреляции.

Отсутствие автокорреляции проверяется по d-критерию Дарбина - Уотсона:


Таблица 4


εi

εi-1

εi- εi-1

(εi- εi-1)2

1

1,284

 

 


2

-1,521

1,284

-2,805

7,868

3

2,611

-1,521

4,132

17,073

4

1,894

2,611

-0,717

0,5141

5

0,089

1,894

-1,805

3,258

6

-1,760

0,089

-1,849

3,4188

7

-2,433

-1,760

-0,673

0,4529

8

-2,106

-2,433

0,327

0,1069

9

3,001

-2,106

5,107

26,081

10

-1,062

3,001

-4,063

16,508

Сумма




75,282


; d=75,282/37,961=1,983.


Так как d-критерий меньше двух, то мы наблюдаем присутствие положительной автокорреляции.

  • Остатки подчиняются нормальному закону распределения.

  1. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента

; ,


; ,


где


Тогда , ; и


tтабл=2,3060 (при 10-2=8 степенях свободы); tа и tb> tтабл, что говорит о значимости параметров модели.

  1. Коэффициент детерминации находится по формуле:


.


Данные возьмем из таблицы 5:

Таблица 5

x

y







1

17

26


3,7


4,1

13,69

16,81

1,284

4,938

2

22

27

8,7

5,1

75,69

26,01

-1,521

5,633

3

10

22

-3,3

0,1

10,89

0,01

2,611

11,868

4

7

19

-6,3

-2,9

39,69

8,41

1,894

9,968

5

12

21

-1,3

-0,9

1,69

0,81

0,089

0,424

6

21

26

7,7

4,1

59,29

16,81

-1,760

6,769

7

14

20

0,7

-1,9

0,49

3,61

-2,433

12,165

8

7

15

-6,3

-6,9

39,69

47,61

-2,106

14,040

9

20

30

6,7

8,1

44,89

65,61

3,001

10,003

10

3

13

-10,3

-8,9

106,09

79,21

-1,062

8,169

Сумма

133

219

 

 

392,1

264,9


83,979

Ср. знач.

13,3

21,9








Для проверки значимости модели используем F-критерий Фишера:


.


Fтабл=5,32 (k1=1, k2=8 степенями свободы) ;

F>Fтабл, что говорит о значимости уравнения регрессии.

Среднюю относительную ошибку аппроксимации находим по формуле:


;


В среднем расчетные значения отклоняются от фактических на 8,4%.

Поскольку найденная средняя относительная ошибка аппроксимации находится в интервале от 5 до 10, то можно утверждать, что модель имеет хорошее качество.

  1. Ширина доверительного интервала находится по формулам:







где tα=1,86 при m=n-2=8 и α=0,1

Т.о.




Верхн. граница: 25,173+4,34=29,513

Нижн. граница: 25,173-4,34=20,833


Таблица 6

Нижняя граница

Прогноз

Верхняя граница

20,83

25,17

29,51


  1. Фактические и модельные значения Y, точки прогноза представлены на графике 2.


График 2



  1. Составить уравнения нелинейной регрессии:

    • Гиперболической

Уравнение показательной кривой имеет вид: ŷ = a + b/x.

Произведем линеаризацию модели путем замены Х = 1/х.

Тогда уравнение примет вид: ŷ = a + bХ- линейное уравнение регрессии.

Данные, необходимые для нахождения параметров приведены в таблице 6


Таблица 7

y

x

X

X2

Xy

ŷ

εi

εi2


1

26

17

0,0588

0,0035

1,5294

24,41

1,59

2,52

6,11

2

27

22

0,0455

0,0021

1,2273

25,10

1,90

3,61

7,04

3

22

10

0,1000

0,0100

2,2000

22,29

-0,29

0,09

1,33

4

19

7

0,1429

0,0204

2,7143

20,09

-1,09

1,18

5,72

5

21

12

0,0833

0,0069

1,7500

23,15

-2,15

4,63

10,24

6

26

21

0,0476

0,0023

1,2381

24,99

1,01

1,02

3,89

7

20

14

0,0714

0,0051

1,4286

23,76

-3,76

14,16

18,82

8

15

7

0,1429

0,0204

2,1429

20,09

-5,09

25,88

33,91

9

30

20

0,0500

0,0025

1,5000

24,87

5,13

26,35

17,11

10

13

3

0,3333

0,1111

4,3333

10,28

2,72

7,38

20,90

Сумма

219

133

1,0757

0,1843

20,0638

 

 

86,82

125,07

Ср.знач.

21,9

13,3

0,1076

0,0184

2,0064

 







Значение параметров а и b линейной модели определим по формулам:




Уравнение регрессии будет иметь вид ŷ = 27,44 – 51,47 X.

Перейдем к исходным переменным, получим уравнение гиперболической модели:


.


График 3







Степенная

Уравнение степенной модели имеет вид: ŷ = a · xb

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:


lg ŷ = lg a + b lg x


Обозначим Y = lg ŷ; A = lg a; X = lg x

Тогда уравнение примет вид: Y = A + bX - линейное уравнение регрессии.

Рассчитаем его параметры, используя данные таблицы 8:


Таблица 8

y

x

Y

X

YX

X2

ŷ

εi

εi2


 

26

17

1,4150

1,2304

1,7411

1,5140

24,545

1,45

2,12

5,60

 

27

22

1,4314

1,3424

1,9215

1,8021

27,142

-0,14

0,02

0,52

 

22

10

1,3424

1,0000

1,3424

1,0000

19,957

2,04

4,17

9,29

 

19

7

1,2788

0,8451

1,0807

0,7142

17,365

1,63

2,67

8,60

 

21

12

1,3222

1,0792

1,4269

1,1646

21,427

-0,43

0,18

2,04

 

26

21

1,4150

1,3222

1,8709

1,7483

26,654

-0,65

0,43

2,51

 

20

14

1,3010

1,1461

1,4911

1,3136

22,755

-2,76

7,59

13,78

 

15

7

1,1761

0,8451

0,9939

0,7142

17,365

-2,37

5,59

15,77

 

30

20

1,4771

1,3010

1,9218

1,6927

26,151

3,85

14,81

12,83

 

13

3

1,1139

0,4771

0,5315

0,2276

12,479

0,52

0,27

4,01

Сумма

219

133

13,2729

10,5887

14,3218

11,8913

 

 

37,86

74,94

Ср.знач.

21,9

13,3

1,3273

1,0589

1,4322

1,1891

 





Значение параметров А и b линейной модели определим по формулам:



Значение параметров А и b линейной модели определим по формулам:




Уравнение регрессии имеет вид: Y=0,91 + 0,39X

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:


ŷ=100,91 · x0,39


ŷ =8,13 · x0,39.


График 4


  • Показательная

Уравнение показательной кривой имеет вид: ŷ = a · bx

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:


lg ŷ = lg a + x lg b


Обозначим Y = lg ŷ; A = lg a; B = lg b

Тогда уравнение примет вид: Y = A + Bx - линейное уравнение регрессии.

Данные, необходимы для нахождения параметров, приведены в таблице 9.


Таблица 9

№наблюдения

y

x

Y

Yx

x2

ŷ

εi

εi2


1

26

17

1,4150

24,0545

289

24,564

1,436

2,06


5,52

2

27

22

1,4314

31,4900

484

29,600

-2,600

6,76

9,63

3

22

10

1,3424

13,4242

100

18,920

3,080

9,49

14,00

4

19

7

1,2788

8,9513

49

16,917

2,083

4,34

10,96

5

21

12

1,3222

15,8666

144

20,385

0,615

0,38

2,93

6

26

21

1,4150

29,7144

441

28,516

-2,516

6,33

9,68

7

20

14

1,3010

18,2144

196

21,964

-1,964

3,86

9,82

8

15

7

1,1761

8,2326

49

16,917

-1,917

3,68

12,78

9

30

20

1,4771

29,5424

400

27,472

2,528

6,39

8,43

10

13

3

1,1139

3,3418

9

14,573

-1,573

2,47

12,10

Сумма

219

133

13,2729

182,8324

2161

 

 

45,75

95,84

Ср.знач.

21,9

13,3

1,3273

18,2832

216,1

 






Значение параметров А и B линейной модели определим по формулам:




Уравнение регрессии будет иметь вид: Y = 1,115 + 0,016x.

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:


ŷ =101,115·(100,016)x;

ŷ =13,03·1,038x.


График 5



  1. Для указанных моделей найти: R2 – коэффициент детерминации и средние относительные ошибки аппроксимации А.

для всех моделей = 264,9 (см. таблицу 5).

  • Степенная модель (см. таблицу 8):

;


;


  • Показательная модель (см.таблицу 9):


;


;


  • Гиперболическая модель (см. таблицу 7):




.


Таблица 10

Параметры

Модели

Коэффициент

детерминации R2

Средняя относительная ошибка аппроксимации А

1. Степенная

0,857

7,5

2. Показательная

0,827

9,6

3. Гиперболическая

0,672

12,5


Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов. Чем ближе R2 к 1, тем выше качество модели.

Чем выше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7% свидетельствует о хорошем качестве модели.

При сравнении гиперболической, степенной и показательной моделей по данным характеристикам мы видим, что наибольшее значение коэффициента детерминации R2 и наименьшую ошибку аппроксимации имеет степенная модель, следовательно, ее можно считать лучшей.


Задача 2


Даны две СФМ, которые заданы в виде матриц коэффициентов модели. Необходимо записать системы одновременных уравнений и проверить обе системы на идентифицируемость.


Таблица 1

№ варианта

№ уравнения

Задача 2а

Задача 2б

переменные

переменные

y1

y2

y3

x1

x2

x3

x4

y1

y2

y3

x1

x2

x3

x4

8

1

-1

b12

b13

0

a12

a13

0

-1

0

b13

a11

0

a13

a14

2

0

-1

b23

a21

a22

0

a24

b21

-1

b23

0

a22

0

a24

3

0

b32

-1

a31

a32

a33

0

b31

0

-1

a31

0

a33

a34


Решение

2а) , тогда система уравнений будет иметь вид:




Модель имеет 3 эндогенные (y1, y2, y3) и 4 экзогенные (x1, x2, x3, x4) переменные. Проверим каждое уравнение на необходимое и достаточное условие идентификации.

1 уравнение: y1= b12y2+b13y3+a12x2+a13x3;

Необходимое условие: D + 1 = H

Эндогенные переменные: y1, y2, y3; H=3

Отсутствующие экзогенные переменные: х1, х4; D=2

2+1=3 - условие необходимости выполнено.

Достаточное условие: В уравнении отсутствуют х1, х4. Построим матрицу из коэффициентов для второго и третьего уравнения:


Таблица 2

Уравнение

переменные

х1

х4

2

a21

a24

3

a31

0

Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.

1-ое уравнение идентифицируемо.

2 уравнение: y2= b23 y3+a21x1+a22x2+a24x4 ;

Необходимое условие: D + 1 = H

Эндогенные переменные: y2, y3; H=2

Отсутствующие экзогенные переменные: х3; D=1

1+1=2 - условие необходимости выполнено.

Достаточное условие: В уравнении отсутствуют y1, х3. Построим матрицу из коэффициентов для первого и третьего уравнения:


Таблица 3

Уравнение

переменные

y1

х3

1

-1

a13

3

0

a33


Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.

2-ое уравнение идентифицируемо.

3 уравнение: y3= b32y2+a31x1+a32x2+a33x3;

Необходимое условие: D + 1 = H

Эндогенные переменные: y2, y3; H=2

Отсутствующие экзогенные переменные: х4; D=1

1+1=2 - условие необходимости выполнено.

Достаточное условие: В уравнении отсутствуют y1, х4. Построим матрицу из коэффициентов для первого и второго уравнения:

Таблица 4

Уравнение

переменные

х1

х4

1

-1

0

2

0

a24


Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.

3-е уравнение идентифицируемо.

В целом вся система уравнений является идентифицируемой.


Решение

2б) ,


Тогда система уравнений будет иметь вид:



Модель имеет 3 эндогенные (y1, y2, y3) и 4 экзогенные (x1, x2, x3, x4) переменные. Проверим каждое уравнение на необходимое и достаточное условие идентификации.

1 уравнение: y1= b13y3+a11x1+a13x3+a14x4;

Необходимое условие: D + 1 = H

Эндогенные переменные: y1, y3; H=2

Отсутствующие экзогенные переменные: х2; D=1

1+1=2 - условие необходимости выполнено.

Достаточное условие: В уравнении отсутствуют y2, х2. Построим матрицу из коэффициентов для второго и третьего уравнения:


Таблица 5

Уравнение

переменные

y2

х2

2

-1

a22

3

0

0


Найдем определитель: , следовательно, условие достаточности НЕ выполнено.

1-ое уравнение НЕидентифицируемо.

2 уравнение: y2= b11 y1+b23y3+a22x2+a24x4 ;

Необходимое условие: D + 1 = H

Эндогенные переменные: y1, y2, y3; H=3

Отсутствующие экзогенные переменные: x1, х3; D=2

2+1=3 - условие необходимости выполнено.

Достаточное условие: В уравнении отсутствуют x1, х3. Построим матрицу из коэффициентов для первого и третьего уравнения:


Таблица 6

Уравнение

переменные

x1

х3

1

a11

a13

3

a31

a33


Найдем определитель: , ранг =2, следовательно, условие достаточности выполнено.

2-ое уравнение идентифицируемо.

3 уравнение: y3= b31y2+a31x1+a33x3+a34x4;

Необходимое условие: D + 1 = H

Эндогенные переменные: y1, y3; H=2

Отсутствующие экзогенные переменные: х2; D=1

1+1=2 - условие необходимости выполнено.

Достаточное условие: В уравнении отсутствуют y1, х4. Построим матрицу из коэффициентов для первого и второго уравнения:


Таблица 7

Уравнение

переменные

y2

х2

1

0

0

2

-1

a22


Найдем определитель: , следовательно, условие достаточности НЕ выполнено

3-е уравнение НЕидентифицируемо.

В целом вся система уравнений является НЕидентифицируемой, так как первое и третье уравнение – НЕидентифицируемы.

2в) По данным, используя косвенный метод наименьших квадратов, построить структурную форму модели вида: y1=a01+b12y2+a11x11;


y2=a02+b21y1+a22x2+ε2


Таблица 8

Вариант

n

y1

y2

x1

x2

8

1

51.3

39.4

3

10

2

112.4

77.9

10

13

3

67.5

45.2

5

3

4

51.4

37.7

3

7

5

99.3

66.1

9

6

6

57.1

39.6

4

1


Решение

      1. Структурную форму модели (СФМ) преобразуем в приведенную форму модели (ПФМ):

Для этого из второго уравнения выражаем y2 и подставляем его в первое, а из первого выражаем y1 и подставляем его во второе уравнение. Получим:


y111x1+ δ12x2+u1;


y221x1+ δ22x2+u2,


где u1 и u1 –случайные ошибки ПФМ.


Здесь



      1. В каждом уравнение ПФМ с помощью МНК определим δ – коэффициент.

Для первого уравнения:



.

Для решения системы уравнений требуются вспомогательные расчеты, которые представлены в таблице 9, 10.


Таблица 9

n

y1

y2

x1

x2

1

51,3

39,4

3

10

2

112,4

77,9

10

13

3

67,5

45,2

5

3

4

51,4

37,7

3

7

5

99,3

66,1

9

6

6

57,1

39,6

4

1

Сумма

439

305,9

34

40

Сред. знач.

73,17

50,98

5,67

6,67


Для упрощения расчетов удобнее работать с отклонениями от средних уровней:


у = у - уср; ∆х = х - хср


Таблица 10

n

y1

y2

x1

x2

y1x1

x12

x1x2

y1x2

y2x1

y2x2

x22

1

-21,9

-11,6

-2,7

3,3

58,31

7,11

-8,89

-72,89

30,89

-38,61

11,11

2

39,2

26,9

4,3

6,3

170,0

18,78

27,44

248,48

116,64

170,47

40,11

3

-5,7

-5,8

-0,7

-3,7

3,78

0,44

2,44

20,78

3,86

21,21

13,44

4

-21,8

-13,3

-2,7

0,3

58,04

7,11

-0,89

-7,26

35,42

-4,43

0,11

5

26,1

15,1

3,3

-0,7

87,11

11,11

-2,22

-17,42

50,39

-10,08

0,44

6

-16,1

-11,4

-1,7

-5,7

26,78

2,78

9,44

91,04

18,97

64,51

32,11

-0,2

-0,1

-0,2

-0,2

404,03

47,33

27,33

262,73

256,17

203,07

97,33


С учетом приведенных данных получим:

404,03 = 47,33δ11 + 27,33δ12

262,73 = 27,33δ11 + 97,33δ12


δ12 = 0,36;


С учетом этого первое уравнение ПФМ примет вид:


y1 = 8,33х1 + 0,36х2 + u1


Для второго уравнения определим δ – коэффициент с помощью МНК:





Для дальнейших расчетов данные берем из таблицы 9, 10. Получим:


256,17=47,33δ21+27,33δ22

203,07=27,33δ21+97,33δ22


δ22 = 0,68;



Второе уравнение ПФМ примет вид:

у2 = 5,02х1 + 0,68х2 + u2


3) Выполним переход от ПФМ к СПФМ. Для этого из последнего уравнения найдем х2:




Найденное х2 подставим в первое уравнение.


,


тогда b12=0,53; a11=5,67

Из первого уравнения ПФМ найдем х1




Подставим во второе уравнение ПФМ


,


тогда b21=0,6; a22=0,46


4) Свободные члены СФМ найдем из уравнения:

а01 = у1ср - b12у2ср - а11х1ср = 73,17 – 0,53 50,98 - 5,67 5,67 = 14,00;

а02 = у2ср - b21у1ср - а22х2ср = 50,98 - 0,6 73,17 - 0,46 6,67 = 4,00.


5) Записываем СФМ в окончательном виде:


y1=a01 + b12y2 + a11x1 + ε1;


y2=a02 + b21y1 + a22x2 + ε2.


y1 =14 + 0,53y2 + 5,67x1 + ε1;


y2 = 4 + 0,6y1 + 0,46x2 + ε2.


Нравится материал? Поддержи автора!

Ещё документы из категории экономика:

X Код для использования на сайте:
Ширина блока px

Скопируйте этот код и вставьте себе на сайт

X

Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.

После чего кнопка «СКАЧАТЬ» станет доступной!

Кнопочки находятся чуть ниже. Спасибо!

Кнопки:

Скачать документ