Важнейшим вопросом, возникающем при анализе двух выборок, является вопрос о наличии различий между выборками. Обычно для этого проводят проверку статистических гипотез о принадлежности обеих выборок одной генеральной совокупности или о равенстве средних. Если вид распределения или функция распределения выборки нам заданы, то в этом случае задача оценки различий двух групп независимых наблюдений может решаться с использованием статистики: либо кри­терия Стьюдента tесли сравнение выборок ведется по сред­ним значениям X и Улибо с использованием критерия Фишера Fесли сравнение выборок ведется по их дисперсиям. Использование параметрических критериев статистики без предварительной про­верки вида распределения может привести к определенным ошибкам в ходе проверки рабочей гипотезы. Табличное значение f критерия фишера преодоления указанных трудностей в практике педагоги­ческих исследований следует использоватьтакие, как критерий знаков, двухвыборочный критерий Вилкоксона, критерий Ван табличное значение f критерия фишера Вардена, критерий Спирмена, выбор которых, хотя и не требует большого числа членов выборки и знаний, вида распределения, но все же зависит от целого ряда условий. Непараметрические критерии статистики - свободны от допущения о законе распределения выборок и табличное значение f критерия фишера на предположении о независимости наблюдений. В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о при­надлежности двух выборок одной совокупности. Эти методы основыва­ются на предположении о том, что распределение выборок подчиняется нормальному гауссовому закону распределения. Среди параметрических критериев статистики табличное значение f критерия фишера будут рассмотрены критерий Стьюдента и Фишера. Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы: 1 в пределах осей можно нарисовать полигон частоты эмпирическую функцию распределения табличное значение f критерия фишера кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми табличное значение f критерия фишера кривая отличается от первой; 2 вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения; 4 после определения среднего значения распределения частоты табличное значение f критерия фишера стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда: а — к интервалу должно относиться около 25% частоты совокупности, б — к интервалу должно относиться около 50% частоты совокупности, в — к интервалу должно относиться около 75% частоты совокупности, г — к интервалу должно относиться около 100% частоты совокупности. Данный критерий наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности». При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух неза­висимых, несвязанных выборок так называемый двухвыборочный t-критерий. Табличное значение f критерия фишера этом случае есть контрольная группа и экспериментальная опытная группа, количество испытуемых в группах может быть различно. Во втором случае, когда одна и та же группа объектов порождает числовой матери­ал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными. Табличное значение f критерия фишера критерия для случая несвязанных, независимых выборок равна: 1 где— средние арифметические в эксперименталь­ной и контрольной группах, - стан­дартная ошибка разности средних арифметических. Находится из формулы:2 где n 1 и n 2 соответственно величины первой и второй выборки. Далее табличное значение f критерия фишера срав­нить полученное значение t эмп с теоретическим значением t—рас­пределения Стьюдента см. Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок. В двух группах учащихся — экспериментальной и контрольной — получены следующие результаты по учеб­ному предмету тестовые баллы; см. Если полученное в эксперименте эмпирическое значение t превы­шает табличное, то есть основания принять альтернативную гипотезу H 1 о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. Здесь могут возникнуть такие вопросы: табличное значение f критерия фишера. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу. Доказано ли преимущество экспериментального метода? Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической эксперимен­тальной группы, a — контрольной: Отсюда следует вывод, что новый метод пока не про­явил себя с хорошей стороны по разным, возможно, при­чинам. В случае табличное значение f критерия фишера выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента. Рассмотрим пример использования t-критерия Стьюдента для связных и, очевидно, равных по численности выборок. Изучался уровень ориентации учащихся на художественно-эстети­ческие ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились бе­седы, выставки детских рисунков, были организованы по­сещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических со­ображений в таблице 2 приводятся результаты небольшо­го числа испытуемых. В терминах статистических гипотез полученный результат будет звучать так: на 5% уров­не гипотеза Н 0 отклоняется и принимается гипотеза Н 1. Критерий Фишера позволяет сравнивать величины выбороч­ных дисперсий двух независимых выборок. Для вычисления F эмп нуж­но найти отношение дисперсий двух выборок, причем так, что­бы большая по величине дисперсия находилась табличное значение f критерия фишера в числителе, а меньшая — в знаменателе. Формула табличное значение f критерия фишера критерия Фи­шера такова: 8 где - дисперсии первой и второй выборки соответственно. Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значе­ние F эмп всегда будет больше или равно единице. В Приложе­нии 1 критические значения критерия Фишера находятся по величинам k 1 верхняя строчка таблицы и k 2 левый столбец таблицы. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами. Для критерия Фишера необходимо сравнить дис­персии тестовых оценок в обоих классах. Резуль­таты тестирования представлены в таблице: Таблица 3. И cследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов. Сравнивая на глазок по процентным соотношениям результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении сдвиге показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат. G-критерий Критерий предназначен для срав­нения состояния некоторого свойства у членов двух зави­симых выборок на основе измерений, сделанных по шка­ле не ниже ранговой. Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида х iу iгде х iу i — результаты двукратного измерения одного и того же свойства у одного и того же объекта. В педагогических исследованиях объектами изуче­ния могут служить учащиеся, учителя, администрация школ. При этом х iу табличное значение f критерия фишера могут быть, табличное значение f критерия фишера, балловы­ми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства. Нулевая гипотеза формулируются следующим обра­зом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. Ста­тистика критерия Т определяется следую­щим образом: допустим, что из N пар х, у, нашлось несколько пар, в которых значения х i и у i равны. Такие пары обозначаются знаком «0» и при подсчете значения ве­личины Т не учитываются. Предположим, что за вы­четом из числа N числа пар, обозначенных знаком табличное значение f критерия фишера, осталось всего n пар. Среди оставшихся n пар подсчита­ем число пар, обозначенных знаком «-», т. Значение величины Т и равно чис­лу пар со знаком минус. Учащиеся выполняли контрольную ра­боту, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью фор­мирования данного понятия у учащихся с низким уров­нем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе. Результаты двукратного выполнения ра­боты представляют измерения по шкале по­рядка пятибалльная шкала. В этих условиях возмож­но применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допуще­ния этого критерия. Результаты двукратного выполнения работы в бал­лах 15 учащимися запишем в форме таблицы см. Альтернативная гипотеза : состояние знаний учащихся повысилось после изучения пособия. Подсчитаем значение статистики критерия Т равное числу положительных разностей отметок, по­лученных учащимися. Для определения критических значений табличное значение f критерия фишера критерия n—ta используем табл. Поэтому в соответствии с правилом принятия решения нулевая гипотеза от­клоняется на уровне значимости 0,05 и принимает­ся альтернативная гипотеза, что позволяет сделать вывод об улучшении знаний учащихся после самостоя­тельного изучения пособия. Предполагается, что изучение курса математики способствует формированию у учащихся одного из приемов логического мышления например, приема обобщения даже в том случае, если его фор­мирование не проводится целенаправленно. Для проверки этого предположения был проведен следующий эксперимент. Учащимся VII класса было предложено 5 задач, решение которых основано на использовании данного приема мышления. Считалось, что учащийся владеет этим приемом, если он дает верный ответ на 3 и более задачи. Была разработана следующая шкала измерений: верно решена 1 или 2 задачи — оценка «0»; верно решено 3 задачи — оценка «1»; верно решено 4 зада­чи— оценка табличное значение f критерия фишера верно решено 5 задач — оценка «3». Работа проводилась дважды: в конце сентября и конце мая следующего года. Ее писали 35 одних и тех же учащихся, отобранных методом случайного отбора из 7 разных школ. Результаты двукратного выполнения работы запишем в форме таблицы см. В соответствии с целями эксперимента формулируем нулевую гипотезу следующим образом: Н 0— изучение математики не способствует формированию изучаемого приема мышления. Тогда альтернативная гипотеза бу­дет иметь вид: Н 1— изучение математики способствует овладению этим приемом мышления. Поэтому в соответ­ствии с правилом принятия решений приходится сделать вывод о том, что полученные ре­зультаты не дают достаточных оснований для отклоне­ния нулевой гипотезы, т. Критерий χ 2 хи-квадрат приме­няется для сравнения распределений объектов двух совокупностей на основе измерений по шкале наименований в двух независимых выборках. Предполо­жим, что состояние изучаемого свойства например, вы­полнение определенного задания измеряется у каждо­го объекта по шкале наименований, имеющей только две взаимоисключающие категории например: выпол­нено верно — выполнено неверно. По результатам из­мерения состояния изучаемого свойства у объектов двух выборок составляется четырехклеточная таблица 2X2. Табличное значение f критерия фишера на основе данных таблицы 2X2 см. При проверке нулевых гипотез не обязательно, чтобы значения вероятностей р 1и р 2были известны, так как гипотезы только устанавливают между ними неко­торые соотношения равенство, больше или меньше. Для проверки рассмотренных выше нулевых гипотез по данным таблицы 2X2 см. Пусть a — принятый уровень значимости. Тогда значение статистики Т, полученное на основе экспериментальных данных, сравнивается с критическим значением статистики х 1-2 a табличное значение f критерия фишера опре­деляется по таблице c 2 c одной степенью свободы см. Приложение 2 с учетом выбранного значения a. Если табличное значение f критерия фишера неравенство не выполняется, то у нас нет достаточных оснований для отклонения нулевой гипотезы. В связи с тем что табличное значение f критерия фишера точного распределения статистики Т распределением c 2 c одной степенью сво­боды дает достаточно хорошее приближение только для больших выборок, применение критерия ограничено не­которыми условиями. Критерий не рекомендуется табличное значение f критерия фишера, если: 1 сумма объемов двух выборок меньше 20; 2 хотя бы одна из абсолютных частот в таблице 2X2, составленной на основе экспериментальных данных, меньше 5. Проводился эксперимент, направленный на выявление лучшего из учебников, написанных двумя авторскими коллективами в соответствии с целями обу­чения геометрии и содержанием программы IX класса. Для проведения эксперимента методом случайного отбо­ра были выбраны два района, большинство школ которых относились по расположению к сельским. Рассмотрим методику сравнения ответов учителей экспериментальных школ двух районов па один из вопросов анкеты: «Доступен ли учебник в целом для самостоятельного чтения и помогает ли он усвоить материал, который учитель не объяснял в классе Ответ: да — нет. Отношение учителей к изучаемому свойству учебников измерено по шкале наименований, имеющей две категории: да, нет. Обе выборки учителей случайные и независимые. Ответы 20 учителей первого района и 15 учителей второго района распределим на две категории и запишем в форме таблицы 2Х2 табл. Все значения в табл. Согласно правилу принятия ре­шений для критерия c 2полученный результат не дает достаточных оснований для отклонения нулевой ги­потезы, т. Применение критерия хи-квадрат возможно и в том случае, когда объекты двух выборок из двух совокупно­стей по состоянию изучаемого свойства распределяют­ся более чем на две категории. Например, учащиеся экспериментальных и контрольных классов распределя­ются на четыре категории в соответствии с отметками в баллах: 2, 3, 4, 5полученными учащимися за вы­полнение некоторой контрольной работы. Результаты измерения состояния изу­чаемого свойства у объектов каждой выборки распре­деляются на С категорий. На основе этих данных со­ставляется таблица 2ХС, в которой два ряда по числу рассматриваемых совокупностей и С колонок по чис­лу различных категорий состояния изучаемого свойства, принятых в исследовании. Возможна, например, проверка гипо­тезы о равенстве вероятностей получения табличное значение f критерия фишера «5», «4», «3» и «2» за выполнение учащимися контрольных и экспериментальных классов некоторого задания. Табличное значение f критерия фишера проверки нулевой гипотезы с помощью критерия c 2 на основе данных таблицы 2ХС подсчитывается значение статисти­ки критерия Табличное значение f критерия фишера по следующей формуле: 10 где п 1и п 2— объемы выборок. Это означает, что распределе­ние объектов на С категорий по состоянию изучаемого свойства различно в двух рассматриваемых совокуп­ностях. Рассмотрим методику сравнения результатов пись­менной работы, проверявшей усвоение одного из разде­лов курса учащимися первого и второго районов. Методом случайного отбора из учащихся первого района, писавших работу, была составлена выборка объ­емом 50 человек, из учащихся второго района — выборка объемом 50 человек. В соответствии со специально разработанными критериями оценки выпол­нения работы каждый ученик мог попасть в одну из че­тырех категорий: плохо, посредственно, хорошо, отлично. Результаты выполнения работы учащимися обеих вы­борок запишем в виде таблицы 2X4 табл. В соответствии с условиями использования критерия c 2 табличное значение f критерия фишера статистики критерия производится по корректированной формуле 10. Согласно правилу принятия ре­шений для критерия c 2полученный результат не дает достаточных оснований для отклонения нулевой ги­потезы. Введение в научное исследование по педагогике: Учеб. Применение математической статистики в педагогических исследованиях. Применение математической статистики в педагогических исследованиях.

Смотрите также: