Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона
Федеральное агентство по образованию РФ
Сибирская государственная автомобильно-дорожная академия (СибАДИ)
Кафедра: «Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Тема: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона»
Выполнила: студентка 23ЭУТ
Хасянова А.Ф.
Проверил: Матвеева С.В
Дата_______________
Оценка_____________
Омск-2010
Содержание
1. Введение. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х
5. Оценки числовых характеристик и параметров выдвинутого закона
6. Теоретическая функция плотности рассматриваемого закона распределения «Построение ее на гистограмме»
7. Проверка критерия Пирсона
Вывод
1. Исходные данные варианта №20
Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.
Таблица 1
79,02
79,70
74,68
20,47
11,70
44,64
40,75
8,59
96,42
6,17
91,75
93,29
77,57
81,25
76,59
51,84
6,17
42,79
80,87
92,81
48,04
14,70
100,64
69,83
94,56
70,42
47,93
47,48
66,79
42,12
20,27
51,36
62,51
66,86
87,99
99,29
5,96
60,38
62,53
75,50
46,55
83,53
55,65
59,26
77,05
101,10
29,93
102,21
86,11
45,92
90,93
24,30
9,76
90,25
36,72
84,96
20,50
81,99
56,29
31,75
43,61
68,70
80,47
100,66
29,98
48,88
40,37
67,46
91,46
59,11
90,75
4,64
36,53
32,39
6,99
8,41
30,85
37,30
64,44
25,60
18,00
84,27
98,88
36,39
34,64
49,49
10,53
50,97
39,40
3,59
100,39
18,57
9,27
10,89
65,91
35,62
75,45
37,86
89,74
4,57
Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.
2. Построение вариационного ряда
Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.
Проранжировав статистические данные, получаем вариационный ряд (табл. 2).
Таблица 2
3,59
9,76
24,30
36,53
44,64
51,84
66,68
77,05
84,96
93,29
4,57
10,53
25,60
36,72
45,92
55,65
66,79
77,75
86,11
94,56
4,64
10,89
29,93
37,30
46,55
56,29
67,46
79,02
87,99
96,42
5,96
11,70
29,98
37,86
47,48
59,11
68,78
79,70
89,74
98,88
6,17
14,70
30,85
39,40
47,93
59,26
69,83
80,47
90,25
99,29
6,17
18,00
31,75
40,37
48,04
60,38
70,42
80,87
90,75
100,39
6,99
18,57
32,39
40,75
48,88
62,51
74,68
81,25
90,93
100,46
8,41
20,27
34,64
42,12
49,49
62,53
75,45
81,99
91,46
100,66
8,59
20,47
35,62
42,79
50,97
64,44
75,50
83,53
91,75
101,10
9,27
20,50
36,39
43,61
51,36
65,71
76,59
84,27
92,81
102,21
3. Построение интервального вариационного ряда
Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.
Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.
Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,
т.е.
– число (частота) попаданий значений X в i-й разряд,
n – объем выборки.
Т.к. согласно теореме Бернулли имеем, что т.е. выборочная относительная частота сходится по вероятности соответствующей вероятности, тогда из условия:
Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С.В. с соответствующими им частотами или относительными частотами.
Для построения интервального вариационного ряда выполняем следующие действия.
Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .
Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса:
где n – объем выборки, К– число частичных интервалов .
,
∆=
10
Определяем начало первого частичного интервала
После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3).
Таблица 3
Разряды
mi
=
1
[3.5-13.5)
14
0.14
0.014
8.5
2
[13.5-23.5)
6
0.06
0.006
18.5
3
[23.5-33.5)
7
0.07
0.007
28.5
4
[33.5-43.5)
12
0.12
0.012
38.5
5
[43.5-53.5)
12
0.12
0.012
48.5
6
[53.5-63.5)
7
0.07
0.007
58.5
7
[63.5-73.5)
8
0.08
0.008
68.5
8
[73.5-83.5)
12
0.12
0.012
78.5
9
[83.5-93.5)
13
0.13
0.013
88.5
10
[93.5-103.5)
9
0.09
0.009
98.5
Контроль
=100
=1
Где -плотность относительной частоты
-середина частичных интервалов
Построение гистограммы
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению
– плотность частоты (или
– плотность частности).
По данным таблицы 4 строим гистограмму (рис. 1).
Гистограмма частот является статистическим аналогом дифференциальной функции распределения (плотности)
случайной величины Х. Площадь гистограммы равна единице.
Выдвижение гипотезы о законе распределения генеральной совокупности
По данным наблюдений статистическое среднее и выборочное среднее квадратическое отклонение у* по значению почти совпадают. Учитывая данный факт, а также вид гистограммы можно предположить, что случайная величина имеет равномерное распределение.
По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.
Оценка числовых характеристик и параметров закона распределения
Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.
Оценка называется точечной, если она определяется числом или точкой на числовой оси.
Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.
При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:
где n - объем выборки, – i-й элемент выборки
Составим таблицу для нахождения и
Таблица 4
i
1
8.5*14=119
2
18.5*6=111
3
28.5*7=199.5
4
38.5*12=462
5
48.5*12=582
6
58.5*7=409.5
7
68.5*8=548
8
78.5*12=942
9
88.5*13=1150.5
10
98.5*9=886.5
6. Равномерный закон
интервальный вариационный генеральный совокупность
Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону
найдем функцию плотности равномерного закона вычислив оценки параметров
и
,
Т.к М(x)= ,
, D(x)=
Таблица 5
i
1
2
3
4
5
6
7
8
9
10
186
После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности
Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона
В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.
Пирсон доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов
интервального вариационного ряда. При увеличении ч2, и находится по формуле:
К = или К =
Дальнейшие вычисления, необходимые для определения расчетного значения выборочной статистики , проведем в таблице 5.
Таблица 6
i
/
1
0.14
14
0.1029
10.29
13.76/10.37=1.33
2
0.06
6
0.1
10
16/10=1.6
3
0.07
7
0.1
10
16/10=1.6
4
0.12
12
0.1
10
16/10=1.6
5
0.12
12
0.1
10
16/10=1.6
6
0.07
7
0.1
10
16/10=1.6
7
0.08
8
0.1
10
16/10=1.6
8
0.12
12
0.1
10
16/10=1.6
9
0.13
13
0.1
10
16/10=1.6
10
0.09
9
0.1149
11.49
6.3/11.49=0.548
01.86
Чтобы найти значение надо воспользоваться табличными распределениями
в которых значение сл. величины находят по заданному уровню значимости
и вычисленному числу степеней свободы
R- число частичных интервалов в таблице 1 но если в некоторых из интервалов значения то надо объединить расположенные рядом интервалы так, чтобы
тогда число
R-это число из необъединенных интервалов
i- число неизвестных параметров
В рассматриваемом эмпирическом распределении не имеются частоты, меньшие 5. Случайная величина ч2 (мера расхождения) независимо от вида закона распределения генеральной совокупности при (n ≥ 50) имеет распределение ч2 с числом степеней свободы
1) К =
уровень значимости б =1–=0,05
,
найдем по таблице значений критическое значение для б = 0,05 и
=9
Имеем =16.9. Так как
то предполагаемая гипотеза о показательном законе распределения генеральной совокупности не противоречит опытным данным и принимается на уровне значимости б.
2)=
,
=
3) M(x)= ,
M(x)=
4) D(x)=
D(x.1)=
5) Таким образом, критическая область для гипотезы задается неравенством ; P(
)=
Это означает, что нулевую гипотезу можно считать правдоподобной и гипотеза Но принимается
Вывод: В ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по критерию Пирсона. Определили параметры и числовые характеристики закона и построили для них доверительные интервалы.

Нравится материал? Поддержи автора!
Ещё документы из категории математика:
Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.
После чего кнопка «СКАЧАТЬ» станет доступной!
Кнопочки находятся чуть ниже. Спасибо!
Кнопки:
Скачать документ