Непараметрические методы

СОДЕРЖАНИЕ: Самостоятельная работа №4 на тему ». Выполнила Попова Татьяна, группа 324. Непараметрические критерии – это критерии, не включающие в формулу расчёта параметров распределения и основанные на оперировании частотами или рангами.

Самостоятельная работа №4 на тему НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ». Выполнила Попова Татьяна, группа 324.

Непараметрические критерии – это критерии, не включающие в формулу расчёта параметров распределения и основанные на оперировании частотами или рангами.

U - критерий Манна-Уитни

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n₁ ,n₂ 3 или n₁ =2, n₂ 5.

Существует несколько способов использования критерия и несколько таблиц критических значений, соответствующих этим способам.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. (1-м рядом (выборкой, группой) называют тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом – тот, где они предположительно ниже.

Чем ниже область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U_эмп , тем более веротно, что различия достоверны.

Ограничения критерия U .

_1. В каждой выборке должно быть не менее 3 наблюдений: n₁ , n₂ 3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

_2. В каждой выборке должно быть не более 60 наблюдений; n₁ , n₂ 60. Однако уже при n₁ , n₂ 20 ранжирование становится достаточно трудоёмким.

Критерий Uтребует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

H - критерий Крускала-Уоллиса

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.

Данный критерий является продолжением критерия U на большее, чем на 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и подсчитываются суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределяется между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой – высокие, а в третьей – средние, то критерий Hпозволит установить эти различия.

Т-критерий Вилкоксона

Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых.

Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью определяется, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.

Этот критерий применяется в тех случаях, когда признаки измерены по крайней мере по шкале порядка, и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применить критерий Т и в тех случаях, когда сдвиги принимают только три значения: -1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, например от -30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.

Суть метода состоит в том, что сопоставляются выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого сначала ранжируются все абсолютные величины сдвигов, а потом суммируют ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Первоначально исходят из предложения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом – сдвиг в более редко встречающемся направлении.

Критерий X ² _r Фридмана

Критерий X² _r применяется для сопоставления показателей, измеренных в трёх или более условиях на одной и той же выборке испытуемых.

Критерий позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений.

Данный критерий является распространением критерия Т Вилкоксона на большее, чем на 2, количество условий измерения. Однако здесь мы ранжируем не абсолютные величины сдвигов, а сами индивидуальные значения, полученные данным испытуемым в 1, 2, 3 и т. д. замерах.

После того, как все значения будут проранжированы, подсчитываются суммы рангов по столбцам для каждого из произведённых замеров.

Если различия между значениями признака, полученными в разных условиях, случайны, то суммы рангов по разным условиям будут приблизительно равны. Но если значения признака изменяются в разных условиях каким-то закономерным образом, то в одних условиях будут преобладать высокие ранги, а в других – низкие. Суммы рангов будут достоверно различаться между собой. Эмпирическое значение критерия X² _r иуказывает на то, насколько различаются суммы рангов. Чем больше эмпирическое значение X² _r , тем более существенные расхождения сумм рангов оно отражает.

Если X² _r равняется критическому значению или превышает его, различия статистически достоверны.

- Критерий Колмогорова-Смирнова

Критерий предназначен для сопоставления двух распределений:

a) Эмпирического с теоретическим, например, равномерным или нормальным;

b) Одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Если в методе Х² сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов и т.д. Таким образом, сопоставляются всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия включается эта разность. Чем больше эмпирическое значение , тем более существенны различия.

Критерий серий Вальда-Вольфовица устроен следующим образом. Представьте, что вы хотите сравнить мужчин и женщин по некоторому признаку. Вы можете упорядочить данные, например, по возрастанию, и найти те случаи, когда субъекты одного и того же пола примыкают друг к другу в построенном вариационном ряде (иными словами, образуют серию). Если нет различия между мужчинами и женщинами, то число и длина «серий», относящиеся к одному и тому же полу, будут более или менее случайными. В противном случае две группы (мужчины и женщины) отличаются друг от друга, то есть не являются однородными. Критерий предполагает, что рассматриваемые переменные являются непрерывными и измерены, по крайней мере, в порядковой шкале. Критерий серий Вальда—Вольфовица проверяет гипотезу о том, что две независимые выборки извлечены из двух популяций, которые в чем-то существенно различаются между собой, иными словами, различаются не только средними, но также формой распределения. Нулевая гипотеза состоит в том, что обе выборки извлечены из одной и той же популяции, то есть данные однородны.

Q -критерий Кохрена

Q-критерий Кохрена — это развитие критерия Макнемара. Критерий проверяет, значимо или нет различаются между собой несколько сравниваемых переменных, принимающих значения 0-1.

Медианный тест — это «грубая» версия критерия Крускала—Уоллиса. STATISTICA просто подсчитывает число наблюдений каждой выборки, которые попадают выше или ниже общей медианы выборок. При нулевой гипотезе (все выборки извлечены из популяций с равными медианами) ожидается, что примерно 50% всех наблюдений в каждой выборке попадают выше (или ниже) общей медианы. Медианный тест особенно полезен, когда шкала содержит искусственные границы, и многие наблюдения попадают в ту или иную крайнюю точку (оказываются «вне шкалы»).

Скачать архив с текстом документа