«Корреляционные зависимости» 11 класс
МБОУ «Учхозская средняя общеобразовательная школа» Краснослободского муниципального района Республики Мордовия
Конспект урока по информатике в 11 классе
«Корреляционные зависимости»
Урок подготовил и провел: учитель информатики и ИКТ Бахарев Юрий Владимирович
п. Преображенский -2013
Цель урока:
а) Познакомить учащихся с понятием корреляционной зависимости;
б) получение представления о корреляционной зависимости величин:
в) освоение способа вычисления коэффициента корреляции с помощью функции КОРРЕЛ.
г) Научить производить расчеты коэффициента корреляции при помощи MS Excel.
Используемые программные средства и учебные материалы:
Учебник информатика и ИКТ 10-11 класс. Базовый курс И.Г. Семакин Бином 20010 г;
Компьютер преподавателя
Компьютеры учащихся – 10 шт.
Локальная сеть
Программное обеспечение: MS PowerPoint, табличный процессор MS Excel;
Продолжительность урока: 40 мин.
План урока
-
1. Организующее начало урока;
.2, Проверка домашнего задания.
Работа над изучаемым материалом.
Закрепление имеющихся знаний и умений,
Практическая работа
Ход урока.
Организующее начало урока.
Проверка домашнего задания. Вопросы и задания к классу
1. а) Что подразумевается под восстановлением значения по регрессионной модели?
б) Что такое экстраполяция?
2. Соберите данные о средней дневной температуре в вашем городе за последнюю неделю (10 дней, 20 дней), оцените, годится ли использование линейного тренда для описания характера изменения температуры со временем. Попробуйте путем графической экстраполяции предсказать температуру через 2-5 дней.
3. Придумайте свои примеры практических задач, для которых имело бы смысл выполнение восстановления значений и экстраполяциоыных расчетов.
Работа над изучаемым материалом Корреляционные зависимости
Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. А сейчас мы рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор А, на него могут оказывать влияние одновременно многие другие факторы: В, С, I) и так далее. Мы рассмотрим два типа задач: 1) требуется, определить, оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А?
2) Какие из факторов Б, С, В и так далее оказывают наибольшее влияние на фактор А?
В качестве примера сложной системы будем рассматривать школу. Пусть, для первого типа задач фактором А, является средняя успеваемость учащихся школы, фактором В Финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п. Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие, причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.
Специалисты по статистике знают, что для того, чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая, информацию из разных школ, нужно выбирать такие школы., в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., нехозяйственные расходы школ разные (у одних школ могут быть богатые спонсоры, у других— нет).
Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб/чел»), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же, пусть оценивается средним баллом учеников школы по результатам окончания последнего учебного года.
Итоги сбора данных по 20 школам, введенные в электронную таблицу, представлены на рис. 2.
На рис. 3 приведена точечная диаграмма, построенная по этим данным, достаточно знать следующее:
коэффициент корреляции (обычно обозначаемый греческой буквой р) есть число, заключенное в диапазоне если это число по модулю близко к 1, то имеет место сильная корреляция, если к 0, то слабая:
• близость ρ к +1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, близость к -1 означает обратное:
значение р легко найти с помощью MS Excel без всяких, формул (разумеется, потому, что в MS Excel они встроены).
В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит в группу статистических функций. Покажем, как ей воспользоваться. На том же листе Excel, где находится, таблица, представленная на рис. 2 , надо установить курсор на любую свободную ячейку и запустить функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем В2:В21 и С2:С21. После их ввода выведется ответ: р= 0,500273843. Эта величина говорит о среднем: уровне корреляции.
Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удовольствием: ходят в чистую, красивую, уютную школу, чувствуют там себя, как дома, и поэтому лучше учатся.
В следующем .примере проводится исследование по определению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной библиотеки учебниками и обеспеченности школы компьютерами. И та и другая характеристика количественно выражаются в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, то есть такое количество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы: книги. Нормой обеспеченности компьютерами будем считать такое их количество, при котором на каждые четыре старшеклассника в школе приходится: один: компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на других уроках, а также во внеурочное время.
В таблице, изображенной на рис. 4, приведены результаты измерения обоих факторов в 11 разных школах. Напомним, что влияние каждого фактора исследуется независимо от других (то есть влияние других существенных факторов должно быть приблизительно одинаковым).
Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне может существовать.
Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляцштными зависимостями.
Раздел математической статистики, который исследует такие зависимости, называется корреляиионным анализом. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости.
Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зависимости. В таком случае мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым он вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе вам
Обеспечение учебного процесса
№
Обеспеченность
Успеваемость
Обеспеченность
Успеваемость
учебниками (% )
(ср. балл)
компьютерами (%)
(ср. балл)
1
50
3.81
10
3.98
2
78
4.15
25
4.01
3
94
4.69
19
4.34
4
65
4.37
78
4.41
5 .
99
4.53
45
3.94
6
87
4:23
32
3.62
7
75о
4.73
90
4.6
8
63
3.69
21
4.24
9
79
4.08
34
4.36
10
94
4.2
45
3.99
р= 0,780931
р = 0.572465
...... .
Рис. 2,18, Сравнение двух корреляционных зависимостей
Для обеих зависимостей получены коэффициенты линейной корреляции, как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением, и. успеваемостью (хотя и тот и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока, еще книга остается более значительным источником знаний, чем компьютер.
Закрепление материала
Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными. С помощью корреляционного анализа можно решить следующие задачи:
определить, оказывает ли один фактор существенное влияние на другой фактор; из нескольких факторов выбрать наиболее существенный.
Количественной мерой корреляции двух величин является коэффициент корреляции.
Значение коэффициента корреляции лежит между -1 И +1. Чем его значение ближе по модулю к 1, тем корреляция (связь) сильнее.
В MS Excel для определения коэффициента корреляции используется функция КОРРЕЛ из группы статистических функций.
Вопросы и задания для повторения
а) Что такое корреляционная зависимость?
б) Что такое корреляционный анализ?
в) Какие типы задач можно решать с помощью корреляционного анализа'?
г) Какая величина является количественной мерой корреляции? Какие
значения она может принимать?С помощью какого средства табличного процессора можно вычислить коэффициент корреляции?
а) Для данных из таблицы, представленной на рис. 2.18, постройте две линейные регрессионные модели.
б) Для этих же данных вычислите коэффициент корреляции. Сравните с приведенными на рис. 4 результатами.
4. Практическая работа
Компьютерный практикум
Работа 15. Расчет корреляционных зависимостей в MS Excel
Цели работы: получение представления о корреляционной зависимости величин; освоение способа вычисления коэффициента корреляции с помощью функции КОРРЕЛ.
Используемые программные средства: табличный процессор MS Excel.
Задание 1
В приведенной ниже таблице содержатся данные о парных измерениях двух величин, произведенных в некоторой
школе; температурь! воздуха в классе х и доли простуженных учащихся у:
Данные измерений
X
У
У
X
У
X
У
X
У
14
30
17
18
20
8
23
2
26
2
14
35
17
15
20
5
23
0
26
1
14
40
17
14
20
4
23
3
26
3
15
32
18
10
21
1
24
3
27
2
15
35
18
6
21
0
24
1
27
4
15
26
18
8
21
2
24
2
27
3
16
20
19
8
27
0
75
1
78
3
16
24 119
7
72 12
25
0
28
2
16
17
19
6
22 |з
25
2
28
4
Зависимость носит статистический характер, поскольку нельзя достоверно сказать, например, что при температуре 15°С в школе болеет 5% учащихся, а при температуре 20° — 2%. Кроме температуры, есть и другие факторы, влияющие на простудные заболевания, различные для разных школ, и все их проконтролировать невозможно.
Последовательно выполнить следующее: => ввести данные в Excel так, как это представлено на рис. 2.12 (см. стр. 107);
--> построить с помощью Мастера диаграмм точечную диаграмму, визуально отображающую табличную зависимость;
-> ответить на вопрос, можно ли на основании этой точечной диаграммы выдвинуть гипотезу о наличии линейной корреляции между величинами;
=> если ответ очевидно отрицательный, то исправить таблицу так, чтобы гипотеза о наличии линейной корреляции стала более правдоподобна;
=> используя функцию КОРРЕЛ, найти коэффициент корреляции и подтвердить или опровергнуть указанную гипотезу.
5. Домашнее задание: п.2.11 Вопросы к п.2.11
Список используемой литературы:
1. Семакин И.Г Учебник Информатика и ИКТ. Базовый уровень 10-11 класс.. М. Бином.
Нравится материал? Поддержи автора!
Ещё документы из категории информатика:
Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.
После чего кнопка «СКАЧАТЬ» станет доступной!
Кнопочки находятся чуть ниже. Спасибо!
Кнопки:
Скачать документ