Математическая статистика
презентация к уроку на тему

Евдокимова Виктория Владимировна

Математическая статистика

Скачать:

ВложениеРазмер
Файл matstatistika.pptx86.54 КБ

Предварительный просмотр:


Подписи к слайдам:

Слайд 1

Математическая статистика

Слайд 2

Основные понятия, используемые в математической обработке психологических данных Математическая обработка – это оперирование со значениями признака, полученного у испытуемого. Признаки и переменные – измеряемые психологические явления. Гипотеза – предположение или догадка. Шкала – это знаковая система.

Слайд 3

Экспериментальное исследование начинается с постановки задач и выбора групп испытуемых, называемых в статистике выборками. Выборки: Независимые (разные группы испытуемых); Зависимые (одних и тех же испытуемые, которые изучаются в разное время или в разных условиях);

Слайд 4

Задачи эксперимента 1) Выявление различий по какому-либо признаку между двумя независимыми выборками. Обычно при сравнении экспериментальной и контрольной групп до начала экспериментального обучения нужно показать, что они не различаются по изучаемым параметрам: по уровню каких-либо знаний, умений или навыков (например, по знанию алфавита или по скорости чтения), по уровню развития когнитивных процессов, по свойствам или качествам личности (например, по уровню развития аналитико-синтетической деятельности, по объему внимания, памяти, по особенностям общения и т.п.) и по другим признакам. По окончании экспериментального обучения для подтверждения его эффективности нужно, наоборот, установить, что показатели в экспериментальной группе выше, чем в контрольной. 2) Выявление изменений в двух зависимых выборках. В этом случае надо выяснить, произошли ли у испытуемых существенные изменения с момента начала экспериментального вмешательства . Убедительным доказательством эффективности экспериментальной методики может служить наличие по окончании эксперимента изменений в экспериментальной группе и отсутствие таковых в контрольной. 3) Установление корреляционных связей. Это нужно тогда, когда исследователь хочет определить, имеется ли связь между отдельными параметрами, например, между скоростью чтения и показателем IQ . Установление сильных корреляционных связей позволяет комплексно решать вопросы обучения, а также воздействовать не на следствия, а на причины того или иного явления. Следует отметить, что список экспериментальных задач не исчерпывается перечисленными группами.

Слайд 5

Шкалы измерения 1) Номинативная, или номинальная, или шкала наименований. Такая шкала показывает, отличается ли одно значение признака от другого по изучаемому параметру или нет. Например, в ответ на просьбу назвать свой любимый предмет, часть учащихся выбрала математику, другая часть — физкультуру и т.д. Учащиеся, выбравшие один и тот же предмет, оказались в одной ячейке шкалы, выбравшие разные предметы — в разных ячейках. Можно посчитать в абсолютных значениях или в процентах частоту выбора каждого учебного предмета. Номинативная шкала относится к качественным шкалам. 2) Ранговая, или ординальная, или порядковая шкала. Пример такой шкалы каждый человек знает с детства. Это пятибалльная шкала школьных оценок. Для ранговой шкалы необходимы критерии, по которым можно сказать, что значения признака не только отличаются или не отличаются друг от друга, но и определить, что одно значение больше другого или равно другому. Применительно к ранговой шкале действуют качественные критерии, поэтому эта шкала также является качественной. Действительно, учитель, ставя оценку, руководствуется соответствующими критериями и собственным опытом. Если при проверке диктанта или письменной работы по математике, как правило, можно точно сосчитать количество ошибок, допущенных учащимся, то в других случаях оценки могут быть спорными (например, за сочинение по литературе).

Слайд 6

3) Интервальная шкала, или шкала равных интервалов. Применяя эту шкалу, мы можем ответить не только на вопрос, какое из значений признака больше, но и насколько больше. Интервальная шкала относится к количественным шкалам. Начало отсчета в ней определяется произвольно, а интервалы равные. Примером может служить температурная шкала Цельсия. Баллы в интервальной шкале можно складывать и вычитать, но нельзя делить и умножать, именно по причине произвольного выбора нулевой точки (мы не можем, пользуясь только шкалой Цельсия, сказать, во сколько раз 5  С больше, чем 0  С). Студенту создать самостоятельно ранговую шкалу достаточно трудно. Для этого необходима большая выборка и знание математической статистики. Применительно к педагогическому исследованию создать ранговую шкалу еще труднее, т.к. объект изучения слишком сложен и не всегда обладает количественными характеристиками. Педагоги в своих исследованиях могут опираться и на работу психологов. Например, можно использовать данные, полученные в результате применения тестов оценки интеллекта, например, учитывать IQ каждого испытуемого. В психологии интервальными считаются стандартизированные шкалы, построенные в единицах стандартного отклонения, например, шкала оценки интеллекта Д. Векслера, шкала стенов Р.Б. Кеттелла . 4) Шкала отношений, или шкала равных отношений. Самая точная количественная шкала. Точка отсчета в этой шкале объективна. Например, температурная шкала Кельвина, шкалы массы, времени, расстояния. По отношению к интервальной шкале имеет смысл вопрос, во сколько раз одно значение признака больше другого. К шкале отношений применимы любые методы математической статистики, но такую шкалу для психолого-педагогического исследования практически невозможно построить ввиду сложности объекта изучения. Иногда мы применяем физическую шкалу, которая является шкалой отношений, для психолого-педагогического исследования. При этом шкала отношений перестает быть таковой, т.к. с ее помощью мы измеряем не физическую величину, а нечто другое. Приведем пример. Экспериментатор просит учащегося оценить, насколько нравится ему ходить в школу. Перед испытуемым находится лист бумаги с начерченным на нем отрезком длиной 100 мм. Крайняя левая точка означает сильное нежелание ходить в школу, крайняя правая — сильное желание. Потом измеряется длина отрезка от его начала до точки, поставленной испытуемым. Понятно, что при такой методике показатели 78 мм и 71 мм нельзя с уверенностью считать различающимися, т.к. измеряется не физическая величина (длина отрезка), а отношение к школе.

Слайд 7

Студенты в дипломных работах обычно создают свою ранговую шкалу. Разделение испытуемых на три группы (класса в классификации) по уровням («средний», «ниже среднего» и «выше среднего») — это уже ранговая шкала. Количество рангов — три. Чем больше классов, тем точнее наше оценивание. Хорошая ранговая шкала начинается от восьми рангов. Но при увеличении количества рангов необходима более тонкая дифференцировка в оценивании, что бывает достаточно трудно при качественных показателях. Для дипломного психолого-педагогического исследования оптимальным можно считать вариант пятибалльной ранговой шкалы, т.к. обычно не удается найти подходящие критерии для увеличения количества рангов. В ранговой шкале различие между рангами не является фиксированной величиной. Например, один ученик получил оценку «четыре», минимально выполнив необходимые требования, а другой ученик получил такую же оценку, не удовлетворив лишь одному критерию для получения оценки «пять». Таким образом, ответ первого ученика ближе к оценке «три», чем ответ второго. Поэтому с рангами нельзя выполнять арифметических действий. Такой показатель, как средний балл, строго говоря, не является корректным и не может служить единственным критерием для сравнения успеваемости учащихся.

Слайд 8

Статистические гипотезы и статистические критерии После получения экспериментальных данных по двум группам испытуемых можно сформулировать статистические гипотезы, которые подразделяются на нулевые и альтернативные. Нулевая гипотеза — это гипотеза об отсутствии различий. Она обозначается Н 0 . Например, уровень сформированности вычислительных навыков в экспериментальной группе не выше, чем в контрольной. Альтернативная гипотеза — это гипотеза о наличии различий. Она является отрицанием нулевой гипотезы и обозначается Н 1 . В нашем случае альтернативная гипотез будет сформулирована так: уровень сформированности вычислительных навыков в экспериментальной группе выше, чем в контрольной. Перед началом обработки данных мы формулируем две гипотезы (нулевую и альтернативную), т.к. не знаем, получит ли альтернативная гипотеза статистическое подтверждение. Статистические гипотезы проверяются с помощью статистических критериев — правил, позволяющих отклонить ложную гипотезу и принять истинную с высокой вероятностью. Когда мы принимаем альтернативную гипотезу, то для психолого-педагогических исследований высокой можем считать вероятность не менее 95%, 99% или 99,9%. Другими словами, вероятность ошибки при этом может составлять соответственно не более 5%, 1% или 0,1% (иначе — 1 0 / 00 , т.е. 1 промилле). Эта вероятность называется уровнем значимости и обозначается соответственно р ≤ 0,05 ; р ≤ 0,01 ; р ≤ 0,001 (читаем соответственно так: «пятипроцентный уровень значимости», «однопроцентный уровень значимости», «уровень значимости — один промилле»). Правило отклонения Н 0 и принятия Н 1 . Если эмпирическое значение критерия меньше критического значения, соответствующего p ≤ 0,05, то принимается Н 0 . Если эмпирическое значение критерия равняется критическому значению, соответствующему p ≤ 0,05 или превышает его, но меньше критического значения, соответствующего p ≤ 0,01, то Н 0 отклоняется и принимается Н 1 ( p ≤ 0,05). Если эмпирическое значение критерия равняется критическому значению, соответствующему p ≤ 0,01 или превышает его, но меньше критического значения, соответствующего p ≤ 0,001, то Н 0 отклоняется и принимается Н 1 ( p ≤ 0,01). Если эмпирическое значение критерия равняется критическому значению, соответствующему p ≤ 0,001 или превышает его, то Н 0 отклоняется и принимается Н 1 ( p ≤ 0,001). Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.

Слайд 9

Расчет критерия знаков G Подсчитать количество нулевых реакций и исключить их из рассмотрения. В результате n уменьшится на количество нулевых реакций . 2) Определить преобладающие направление изменений. Считать сдвиги в преобладающем направлении «типичными». 3) Определить количество «нетипичных» сдвигов. Считать это число эмпирическим значением G . 4) По таблице «Критические значения критерия знаков G для уровней статистической значимости по Оуэну Д.Б.» определить критические значения G для данного n . 5) Сопоставить G эмп c G кр . Если G эмп меньше G кр или по крайне мере равен ему ,сдвиг в типичную сторону может считаться достоверным.

Слайд 10

n до после сдвиг n до после сдвиг 1 5 5 0 9 0 2 + 2 2 4 6 + 2 10 6 5 – 1 3 3 5 + 2 11 4 6 + 2 4 8 7 – 1 12 4 4 0 5 2 5 + 3 13 5 6 + 1 6 7 7 0 14 3 3 0 7 5 6 + 1 15 6 8 + 2 8 1 4 + 3 16 2 5 + 3 У учащихся класса ( n = 16) измерялось количество правильно выполненных контрольных заданий до и после экспериментального обучения (см. таб.). Можно ли говорить о достоверных изменениях в количестве выполненных заданий? Таблица . Количество выполненных контрольных заданий до и после экспериментального обучения. ПРИМЕР

Слайд 11

Исключим из внимания все случаи нулевых сдвигов. Таких случаев 4. Поэтому n = 16 – 4 = 12. Типичный сдвиг — положительный. Нетипичные сдвиги наблюдаются у испытуемых под номерами 4 и 10. В ситуации реального педагогического исследования испытуемые, у которых наблюдаются нулевые или отрицательные сдвиги, требуют особого внимания. Необходим анализ причин такого положения. Теперь можно сформулировать гипотезы. Н 0 : увеличение числа выполненных контрольных заданий является случайным. Н 1 : увеличение числа выполненных контрольных заданий не является случайным. Эмпирическое значение критерия равно количеству нетипичных сдвигов: G эмп = 2 Из таблицы критических значений узнаем, что 2 ( p ≤ 0,05 ) G кр = 1 ( p ≤ 0,01)

Слайд 12

Посмотрим на «ось значимости», не забывая о том, что критерий знаков относится к исключениям: 1 2 G G кр 0,01 G кр 0,05 = = G эмп По правилу отклонения Н 0 и принятия Н 1 (см. исключения), если G кр 0,01  G эмп ≤ G кр 0,05 , то принимаем Н 1 ( p ≤ 0,05 ). Вывод. Увеличение числа выполненных контрольных заданий не является случайным ( p ≤ 0,05 ).

Слайд 13

Последовательность действий исследователя. Сформулировать задачу исследования в соответствии с целью исследования. Сформулировать содержательную гипотезу. Подобрать выборки испытуемых. Выбрать шкалу измерения. Измерить значения признака. Выбрать статистические критерии в соответствии с задачей исследования и шкалой измерения. Проверить соответствие исследовательской задачи ограничениям использования критерия. Сформулировать статистические гипотезы (в отдельных случаях они формулируются в ходе расчета критерия). Применить статистические критерии, тщательно проверяя правильность вычислений. Если критерий не подтверждает содержательную гипотезу, то: применить более мощный критерий; увеличить количество испытуемых; пересмотреть гипотезу; пересмотреть организацию исследования.