Описательная статистика манна уитни. Расчет по методике манн-уитни

Критерий Манна-Уитни U-критерий Манна-Уитни используется для оценки различий между двумя малыми выборками (n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5) по уровню количественно измеряемого признака. При этом первой выборкой принято считать ту, где значение признака больше. Нулевая гипотеза H 0 ={уровень признака во второй выборке не ниже уровня признака в первой выборке}; альтернативная гипотеза – H 1 ={уровень признака во второй выборке ниже уровня признака в первой выборке}. Рассмотрим алгоритм применения U-критерия Манна-Уитни: 1. Перенести все данные испытуемых на индивидуальные карточки, пометив карточки 1-й выборки одним цветом, а 2-й – другим. 2. Разложить все карточки в единый ряд по степени возрастания признака и проранжировать в таком порядке. 3. Вновь разложить карточки по цвету на две группы. 4. Подсчитать сумму рангов отдельно по группам и проверить, совпадает ли общая сумма рангов с расчетной. 5. Определить большую из двух ранговых сумм . 6. Вычислить эмпирическое значение U : , где - количество испытуемых в - выборке (i = 1, 2), - количество испытуемых в группе с большей суммой рангов. 7. Задать уровень значимости α и, используя специальную таблицу, определить критическое значение U кр (α) . Если , то H 0 на выбранном уровне значимости принимается. Рассмотрим использование U критерия Манна-Уитни на примере. Проведение срезовой контрольной работы по математике (алгебра и геометрия) в средней общеобразовательной школе дало следующие результаты по 10-балльной шкале для класса, обучающегося по программе «Развивающего обучения» (7 «Б»), и класса, обучающегося по традиционной системе (7 «А»):

Определите, превосходят ли учащиеся 7 «Б» учащихся 7 «А» по уровню знаний по математике.

Сравнение результатов показывает, что баллы, полученный за контрольную работу, в 7 «Б» классе несколько выше, поэтому первой считаем выборку результатов 7 «Б» класса. Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной. Если можно, то это будет означать, что класс, обучающийся по системе «развивающего обучения» имеет более качественные знания по математике. В противном случае, на выбранном уровне значимости различие окажется несущественным.

Для оценки различий между двумя малыми выборками (в данном примере их объёмы равны: n 1 =12, n 2 =11) используем критерий Манна-Уитни. Проранжируем представленную таблицу:

7 «Б» (баллы) ранг 7 «А» (баллы) ранг
22,5
22,5 20.5
20.5 16.5
16.5 16.5
16.5 11.5
16.5 11.5
16.5 7.5
11.5 7.5
11.5 7.5
7.5 4.5
4.5
Сумма: 168.5 Сумма: 107.5

При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания. Например, 4 балла получили 3 ученика (см. таблицу). Значит, первые 3 позиции в расположении займёт балл, равный 4. Поэтому ранг для 4 баллов – это среднее арифметическое для позиций 1, 2 и 3, или: . Аналогично рассуждаем при вычислении ранга для балла, равного 5. Такой балл получили двое учащихся. Значит, при распределении по возрастанию первые три позиции занимает балл, равный 4, а четвёртую и пятую позиции займёт балл, равный 5. Поэтому его ранг будет равен среднему арифметическому между числами 4 и 5, т.е. 4.5.

Используя предложенный принцип ранжирования, получим таблицу рангов. Заметим, что выбор среднего арифметического в качестве ранга применяется при любом ранжировании, в том числе необходимого и для вычисления других критериев достоверности или же коэффициента корреляции Спирмена.

Чтобы использовать критерий Манна-Уитни, рассчитаем суммы рангов рассматриваемых выборок (см. таблицу). Сумма для первой выборки равна 168,5, для второй – 107,5. Обозначим наибольшую из этих сумм через T x (T x =168.5). Среди объёмов n 1 и n 2 выборок наибольший обозначим n x . Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:

T x =168,5, n x =12>11=n 2 . Тогда:

Критическое значение критерия находим по специальной таблице. Пусть уровень значимости равен 0.05.

Гипотеза H 0 о незначительности различий между баллами двух классов принимается, если u кр

Следовательно, различия в уровне знаний по математике среди учащихся можно считать несущественными.

Схема использования критерия Манна-Уитни выглядит следующим образом

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо количественно измеренного признака, при распределении вариант отличном от нормального . Более того, он позволяет выявлять различия между малыми выборками (когда n 1 , n 2 ³3 или n 1 =2, n 2 ³5). Этот метод определяет насколько слабо перекрещиваются (совпадают) значения между двумя выборками. Чем меньше перекрещивающихся значений, тем более вероятно, что различия достоверны.

Чем меньше U эмп тем более вероятно, что различия достоверны.

Нулевая гипотеза: уровень признака в выборке 2 не ниже уровня признака в выборке 1.

Прежде чем проводить оценку критерием U необходимо провести ранжирование.

ОПРЕДЕЛЕНИЕ: Ранжирование – распределение вариант внутри вариационного ряда от меньших величин к большим.

Правила ранжирования:

1. Меньшему значению начисляется меньший ранг, как правило, это 1. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений (если n=10, то наибольшее значение получит ранг 10).

2. Если несколько значений равны, им начисляется ранг, представляющийсобой среднее значение из тех рангов, которые они получили бы, если бы не были равны:

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле: , где N- общее количество ранжируемых значений. Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

Пример .

Проранжируем следующий ряд.

По формуле проверим правильность ранжирования.

. Определим сумму рангов: 1+2,5+2,5+4+5+6+7=28.

Общая сумма рангов совпадает с расчетной. Следовательно мы правильно проранжировали.

Схема подсчета критерия Манна-Уитни:

Чем меньше значения U , тем достоверность различий выше и тем больше уверенности в отклонении нулевой гипотезы.


3 пример .

При заболеваниях сетчатки повышается проницаемость ее сосудов. Исследователи измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением. Полученные результаты приведены в таблице.

Проверить, подтверждают ли эти данные гипотезу о различии в проницаемости сосудов сетчатки.

Нулевая гипотеза : проницаемость сосудов сетчатки при заболеваниях сетчатки у больных не больше, чем у здоровых, (нет статистического различия между двумя выборками).

Альтернативная гипотеза : проницаемость сосудов сетчатки при заболеваниях сетчатки у больных больше, чем у здоровых, (есть статистическое различие между двумя выборками).

Здоровые больные
Порядковый номер Ранг проницаемость сосудов сетчатки Порядковый номер Ранг
0,5 1,2 6,5
0,7 2,5 1,4
0,7 2,5 1,6
1,0 4,5 1,7
1,0 4,5 1,7
1,2 6,5 1,8
1,4 2,2 18,5
1,4 2,3
1,6 2,4
1,6 6,4
1,7
2,2 18,5 23,6

Критерий U Манна - Уитни

Назначение критерия. Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда п 1, п 2 > 3 или п Л = 2, п 2 > 5, и является более мощным, чем критерий Q Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок. Эмпирическое значение критерия и отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше t/ 3Mn , тем более вероятно, что различия достоверны.

Гипотезы.

Уровень невербального интеллекта в группе студентов физиков выше, чем в группе студентов-психологов.

Графическое представление критерия U. Па рис. 7.25 представлены три из множества возможных вариантов соотношения двух рядов значений.

В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения (S j) слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.

В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна (5 2). Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.

В варианте (в) второй ряд ниже первого, но область наложения настолько обширна (5 3), что различия между рядами скрадываются.

Рис. 7.25.

в двух выборках

Примечание. Перекрытием (5 t , S 2 , *$з) обозначены зоны возможного наложения. Ограничения критерия U.

  • 1. В каждой выборке должно быть не менее трех наблюдений: n v п 2 > 3; допускается, чтобы в одной выборке было два наблюдения, но тогда во второй их должно быть не менее 5.
  • 2. В каждой выборке должно быть не более 60 наблюдений; п л, п 2 щ, п 2 > 20 ранжирование становится достаточно трудоемким.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума было с высоким уровнем значимости определено, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в таблице.

2 ниже уровня признака в выборке 1 на достоверно значимом уровне. Чем меньше значения U, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале нашего примера. В результате работы по 1-6 шагам алгоритма построим таблицу (табл. 7.4).

Таблица 7.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Студенты-физики (п = 14)

Студенты-психологи (п= 12)

Показатель невербального интеллекта

Средние 107,2

Общая сумма рангов: 165 + 186 = 351. Расчетная сумма по формуле (5.1) такова:

Равенство реальной и расчетной сумм соблюдено. Мы видим, что по уровню невербального интеллекта более «высоким» рядом окалывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186. Теперь мы готовы сформулировать статистические гипотезы:

Я 0: группа студентов-психологов не превосходит группу студентов- физиков по уровню невербального интеллекта;

Я,: группа студентов-психологов превосходит группу студентов-физи- ков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпирическую величину U :

Поскольку в нашем случае п л * п 2 , подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу (7.4) соответствующее ей п х.:

По приложению 8 определяем критические значения для п л = 14, п 2 = 12:

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если {/ эмп U Kp 0 05 (при ^эмп = 60, и шп > U Kf) о,05).

Следовательно, Н 0 принимается следующей: группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая Q-критерий Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значения невербального интеллекта приходятся на группу физиков (см. табл. 7.4).

По уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ).

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.

Использование критерия

Для применения U-критерия Манна - Уитни нужно произвести следующие операции.

Автоматический расчет U-критерия Манна - Уитни

Таблица критических значений

См. также

  • Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.

Литература

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
  • Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.

Wikimedia Foundation . 2010 .

  • U-954
  • U-точка женщины

Смотреть что такое "U-критерий Манна - Уитни" в других словарях:

    критерий Манна Уитни - — Тематики электросвязь, основные понятия EN Mann Whitney U test … Справочник технического переводчика

    Критерий Манна-Уитни

    Критерий Манна-Уитни-Вилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий Манна-Уитни-Уилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    U-критерий Манна - U критерий Манна Уитни (англ. Mann Whitney U test) статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… … Википедия

    U-критерий Манна-Уитни - (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми … Википедия

    Критерий согласия Колмогорова - или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

    Критерий Краскела - Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия

    Критерий Кохрена - Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия

    Критерий Вальда - (максиминный критерий) один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на … Википедия

Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

H 0 : Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1 : Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения U-критерия Манна-Уитни

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 ,n 2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 , n 2 ≤ 60.

Автоматический расчет U-критерия Манна-Уитни

Шаг 1

Введите в первую колонку («Выборка 1») данные первой выборки, а во вторую колонку («Выборка 2») данные второй выборки. Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести автоматический расчет U-критерия Манна-Уитни.