Estadísticas descriptivas de Mann Whitney. Cálculo mediante el método de Mann-Whitney

Prueba de Mann-Whitney La prueba U de Mann-Whitney se utiliza para evaluar las diferencias entre dos muestras pequeñas (n 1, n 2 ≥3 o n 1 =2, n 2 ≥5) en términos del nivel de una característica medida cuantitativamente. En este caso se considera primera muestra aquella donde el valor del atributo es mayor. Hipótesis nula H 0 =(el nivel de la característica en la segunda muestra no es inferior al nivel de la característica en la primera muestra); hipótesis alternativa – H 1 = (el nivel de la característica en la segunda muestra es menor que el nivel de la característica en la primera muestra). Consideremos el algoritmo para aplicar la prueba U de Mann-Whitney: 1. Transfiera todos los datos de los sujetos de prueba a tarjetas individuales, marcando las tarjetas de la primera muestra con un color y la segunda con otro. 2. Organice todas las tarjetas en una sola fila según el grado de atributo creciente y clasifíquelas en ese orden. 3. Reorganice las tarjetas por color en dos grupos. 4. Calcule la suma de rangos por separado para los grupos y verifique si la suma total de rangos coincide con la calculada. 5. Determina la mayor de las dos sumas de rangos. 6. Calcula el valor empírico. Ud.: , donde es el número de sujetos de la muestra ( i= 1, 2), - el número de sujetos en el grupo con una suma mayor de rangos. 7. Establezca el nivel de significancia α y, utilizando una tabla especial, determine el valor crítico. U cr (α). Si entonces h Se acepta 0 en el nivel de significancia seleccionado. Consideremos el uso de la prueba U de Mann-Whitney usando un ejemplo. La realización de una prueba transversal en matemáticas (álgebra y geometría) en una escuela secundaria arrojó los siguientes resultados en una escala de 10 puntos para una clase que estudia bajo el programa "Educación para el desarrollo" (7 "B") y una clase que estudia bajo el programa sistema tradicional (7 “B”).

Determinar si los estudiantes 7 "B" son superiores a los estudiantes 7 "A" en términos de conocimientos en matemáticas.

Una comparación de los resultados muestra que las puntuaciones recibidas en la prueba en el séptimo grado "B" son ligeramente más altas, por lo que consideramos primero la muestra de resultados del séptimo grado "B". Por tanto, es necesario determinar si la diferencia existente entre las puntuaciones puede considerarse significativa. Si es posible, esto significará que la clase que estudia bajo el sistema de “educación para el desarrollo” tendrá mejores conocimientos en matemáticas. De lo contrario, al nivel de significancia seleccionado la diferencia será insignificante.

Para evaluar las diferencias entre dos muestras pequeñas (en este ejemplo, sus volúmenes son iguales: n 1 =12, n 2 =11), utilizamos la prueba de Mann-Whitney. Clasifiquemos la tabla presentada:

7 "B" (puntos) rango 7 "A" (puntos) rango
22,5
22,5 20.5
20.5 16.5
16.5 16.5
16.5 11.5
16.5 11.5
16.5 7.5
11.5 7.5
11.5 7.5
7.5 4.5
4.5
Suma: 168.5 Suma: 107.5

Al clasificar, combinamos dos muestras en una. Los rangos se asignan en orden ascendente del valor de la cantidad medida, es decir el rango más bajo corresponde a la puntuación más baja. Tenga en cuenta que si las puntuaciones de varios estudiantes coinciden, el rango de dicha puntuación debe considerarse como la media aritmética de las posiciones ocupadas por estas puntuaciones cuando se organizan en orden ascendente. Por ejemplo, 3 estudiantes recibieron 4 puntos (ver tabla). Esto significa que las 3 primeras posiciones del ordenamiento serán ocupadas por una puntuación igual a 4. Por lo tanto, la clasificación para 4 puntos es la media aritmética de las posiciones 1, 2 y 3, o: . Razonamos de manera similar al calcular la clasificación para una puntuación igual a 5. Dos estudiantes recibieron esta puntuación. Esto significa que distribuidos en orden ascendente, las tres primeras posiciones las ocuparán una puntuación igual a 4, y las posiciones cuarta y quinta estarán ocupadas por una puntuación igual a 5. Por tanto, su rango será igual a la media aritmética entre los números 4 y 5, es decir 4.5.

Utilizando el principio de clasificación propuesto, obtenemos una tabla de clasificaciones. Tenga en cuenta que la elección de la media aritmética como rango se utiliza para cualquier clasificación, incluida la necesaria para calcular otros criterios de confiabilidad o el coeficiente de correlación de Spearman.

Para utilizar la prueba de Mann-Whitney, calculamos las sumas de rangos de las muestras consideradas (ver tabla). La suma de la primera muestra es 168,5, de la segunda, 107,5. Denotemos la mayor de estas sumas por T x (T x =168,5). Entre los volúmenes de muestras n 1 y n 2, denotamos el mayor como n x . Estos datos son suficientes para utilizar la fórmula para calcular el valor empírico del criterio:

T x =168,5, n x =12>11=n 2. Entonces:

Encontramos el valor crítico del criterio utilizando una tabla especial. Sea el nivel de significancia 0,05.

Se acepta la hipótesis H 0 sobre la insignificancia de las diferencias entre las puntuaciones de dos clases si u cr

Por tanto, las diferencias en el nivel de conocimientos matemáticos entre los estudiantes pueden considerarse insignificantes.

El esquema para utilizar la prueba de Mann-Whitney es el siguiente

El criterio pretende evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente, con una variante de distribución diferente de normal. Además, nos permite identificar diferencias entre pequeñas muestras(cuando n 1, n 2 ³3 o n 1 =2, n 2 ³5). Este método determina qué tan débilmente se superponen (coinciden) los valores entre dos muestras. Cuantos menos valores se superpongan, más probable será que las diferencias sean significativas.

Cuanto menor sea Uem, más probable es que las diferencias sean significativas.

Hipótesis nula: el nivel del rasgo en la muestra 2 no es inferior al nivel del rasgo en la muestra 1.

Antes de evaluar el criterio Ud. Es necesario hacer una clasificación.

DEFINICIÓN: que van – distribución de variantes dentro de la serie de variaciones de valores menores a mayores.

Reglas de clasificación:

1. Al valor más pequeño se le asigna un rango inferior, generalmente es 1. Al valor más grande se le asigna un rango correspondiente al número de valores clasificados (si n = 10, entonces el valor más grande recibirá un rango de 10).

2. Si varios valores son iguales, se les asigna un rango que es el promedio de los rangos que recibirían si no fueran iguales:

3. La suma total de rangos debe coincidir con la calculada, que viene determinada por la fórmula: , donde N es el número total de valores clasificados. Una discrepancia entre las sumas de rangos reales y calculadas indicará un error cometido al calcular los rangos o resumirlos. Antes de continuar, debes encontrar el error y solucionarlo.

Ejemplo.

Clasifiquemos la siguiente fila.

Utilizando la fórmula, comprobaremos la exactitud de la clasificación.

. Determinemos la suma de rangos: 1+2,5+2,5+4+5+6+7=28.

La suma total de rangos coincide con la calculada. Por lo tanto, clasificamos correctamente.

Esquema de cálculo del criterio de Mann-Whitney:

Cuanto menor sea el valor Ud., mayor es la confiabilidad de las diferencias y mayor la confianza para rechazar la hipótesis nula.


3 ejemplo.

En las enfermedades de la retina, aumenta la permeabilidad de sus vasos. Los investigadores midieron la permeabilidad vascular de la retina en personas sanas y en pacientes con daño retiniano. Los resultados obtenidos se muestran en la tabla.

Probar si estos datos apoyan la hipótesis de diferencias en la permeabilidad vascular de la retina.

Hipótesis nula : la permeabilidad de los vasos retinianos en enfermedades de la retina en pacientes no es mayor que en los sanos (no hay diferencia estadística entre las dos muestras).

Hipótesis alternativa : la permeabilidad de los vasos retinianos en pacientes con enfermedades de la retina es mayor que en los sanos (existe una diferencia estadística entre las dos muestras).

Saludable enfermo
Número de serie Rango permeabilidad vascular de la retina Número de serie Rango
0,5 1,2 6,5
0,7 2,5 1,4
0,7 2,5 1,6
1,0 4,5 1,7
1,0 4,5 1,7
1,2 6,5 1,8
1,4 2,2 18,5
1,4 2,3
1,6 2,4
1,6 6,4
1,7
2,2 18,5 23,6

Prueba U de Mann-Whitney

Finalidad del criterio. El criterio pretende evaluar las diferencias entre dos muestras por nivel cualquier característica medida cuantitativamente. Le permite identificar diferencias entre pequeño muestras cuando PAG 1, pág 2 > 3 o norte L = 2, norte 2 > 5, y es más poderoso que el criterio. q Rosenbaum.

Este método determina si el área de valores de cruce entre dos series es lo suficientemente pequeña. Recordamos que llamamos a la 1ª fila (muestra, grupo) la fila de valores en la que los valores, según estimaciones preliminares, son mayores, y a la 2ª fila es aquella donde supuestamente son menores.

Cuanto menor sea el área de valores cruzados, más probable es que diferencias confiable. Estas diferencias a veces se denominan diferencias en ubicación dos muestras. El valor empírico del criterio refleja qué tan grande es la zona de coincidencia entre las filas. Es por eso lo menos t/ 3Mn, especialmente es probable que las diferencias confiable.

Hipótesis.

El nivel de inteligencia no verbal en el grupo de estudiantes de física es mayor que en el grupo de estudiantes de psicología.

Representación gráfica del criterio.Ud. Papá Fig. La figura 7.25 presenta tres de las muchas opciones posibles para la relación entre dos series de valores.

En la opción (a), la segunda fila es más baja que la primera y las filas apenas se cruzan. Área de superposición ( S j) demasiado pequeño para ocultar las diferencias entre filas. Existe la posibilidad de que las diferencias entre ellos sean confiables. Podemos determinar esto con precisión utilizando el criterio. Ud.

En la opción (b), la segunda fila también es más baja que la primera, pero el área de valores que se cruzan en las dos filas es bastante extensa (5 2). Es posible que aún no alcance un valor crítico, cuando las diferencias deberán considerarse insignificantes. Pero sólo puede determinarse si esto es así calculando con precisión el criterio Ud.

En la opción (c), la segunda fila es más baja que la primera, pero el área de superposición es tan amplia (5 3) que las diferencias entre las filas quedan ocultas.

Arroz. 7.25.

en dos muestras

Nota. La superposición (5 t, S 2, *$з) indica áreas de posible superposición. Limitaciones del criterioUd.

  • 1. Cada muestra deberá tener al menos tres observaciones: norte v p 2 > 3; Se permite que en una muestra haya dos observaciones, pero luego en la segunda debe haber al menos 5 de ellas.
  • 2. Cada muestra no deberá contener más de 60 observaciones; p l, p 2 u, p 2 > 20 la clasificación se vuelve bastante laboriosa.

Volvamos a los resultados de una encuesta a estudiantes de las facultades de física y psicología de la Universidad de Leningrado utilizando la metodología de D. Wexler para medir la inteligencia verbal y no verbal. Usando criterio q Rosenbaum determinó con alto nivel de significancia que el nivel de inteligencia verbal en la muestra de estudiantes de la Facultad de Física era mayor. Intentemos ahora establecer si este resultado se reproduce al comparar muestras según el nivel de inteligencia no verbal. Los datos se muestran en la tabla.

2 es inferior al nivel de la característica en la muestra 1 en un nivel confiablemente significativo. Cuanto menor sea el valor tú, mayor será la confiabilidad de las diferencias.

Ahora hagamos todo este trabajo basándonos en nuestro ejemplo. Como resultado de trabajar en los pasos 1 a 6 del algoritmo, crearemos una tabla (Tabla 7.4).

Tabla 7.4

Cálculo de sumas de rangos para muestras de estudiantes de las facultades de física y psicología.

estudiantes de fisica (PAG = 14)

estudiantes de psicologia (n= 12)

Índice de inteligencia no verbal

Promedio 107,2

Suma total de rangos: 165 + 186 = 351. La suma calculada según la fórmula (5.1) es la siguiente:

Se mantiene la igualdad entre importes reales y calculados. Vemos que en términos del nivel de inteligencia no verbal, la muestra de estudiantes de psicología ocupa un lugar más alto. Es esta muestra la que representa la gran suma de clasificación: 186. Ahora estamos listos para formular hipótesis estadísticas:

I 0: el grupo de estudiantes de psicología no supera al grupo de estudiantes de física en términos de inteligencia no verbal;

I: un grupo de estudiantes de psicología es superior a un grupo de estudiantes de física en términos de inteligencia no verbal.

De acuerdo con el siguiente paso del algoritmo, determinamos el valor empírico. Ud. :

Porque en nuestro caso p l * p 2, calculemos el valor empírico Ud. y para la suma de segundo rango (165), sustituyendo en la fórmula (7.4) su correspondiente px.:

Utilizando el Apéndice 8, determinamos los valores críticos para p l = 14, norte 2 = 12:

Recordamos que el criterio Ud. es una de las dos excepciones a la regla general para decidir la confiabilidad de las diferencias, es decir, podemos establecer diferencias significativas si (/ em Ukp 0 05 (en ^amp = 60, y shp > U Kf) o.05).

Por eso, H 0 Se acepta de la siguiente manera: un grupo de estudiantes de psicología no supera a un grupo de estudiantes de física en cuanto al nivel de inteligencia no verbal.

Tenga en cuenta que para este caso, el criterio Q de Rosenbaum no es aplicable, ya que el rango de variabilidad en el grupo de físicos es más amplio que en el grupo de psicólogos: tanto los valores más altos como los más bajos de inteligencia no verbal ocurren en el grupo de físicos (ver Tabla 7.4).

Por el nivel de cualquier atributo, medido cuantitativamente. Le permite identificar diferencias en los valores de los parámetros entre muestras pequeñas.

Otros nombres: prueba de Mann-Whitney-Wilcoxon Mann-Whitney-Wilcoxon, MWW ), prueba de suma de rangos de Wilcoxon (ing. Prueba de suma de rangos de Wilcoxon) o prueba de Wilcoxon-Mann-Whitney (ing. Prueba de Wilcoxon-Mann-Whitney ).

Historia

Este método para identificar diferencias entre muestras fue propuesto en 1945 por Frank Wilcoxon ( F. Wilcoxon). En 1947 fue revisado y ampliado sustancialmente por H. B. Mann ( HB Mann) y D. R. Whitney ( DR Whitney), por cuyos nombres hoy se le suele llamar.

Descripción del criterio

Prueba no paramétrica simple. La potencia de la prueba es mayor que la de la prueba Rosenbaum Q.

Este método determina si el área de valores superpuestos entre dos series (una serie clasificada de valores de parámetros en la primera muestra y los mismos en la segunda muestra) es lo suficientemente pequeña. Cuanto menor sea el valor del criterio, más probable será que las diferencias entre los valores de los parámetros en las muestras sean confiables.

Limitaciones a la aplicabilidad del criterio

  1. Cada muestra debe tener al menos 3 valores característicos. Se permite que en una muestra haya dos valores, pero luego en la segunda haya al menos cinco.
  2. No debe haber valores coincidentes en los datos de muestra (todos los números son diferentes) o muy pocas coincidencias.

Usando el criterio

Para aplicar la prueba U de Mann-Whitney, es necesario realizar las siguientes operaciones.

Cálculo automático de la prueba U de Mann-Whitney

tabla de valores críticos

ver también

  • La prueba de Kruskal-Wallis es una generalización multivariada de la prueba U de Mann-Whitney.

Literatura

  • Mann H. B., Whitney D. R. En una prueba de si una de dos variables aleatorias es estocásticamente mayor que la otra. // Anales de estadística matemática. - 1947. - No. 18. - P. 50-60.
  • Wilcoxon F. Comparaciones individuales por métodos de clasificación. // Boletín de Biometría 1. - 1945. - P. 80-83.
  • Gubler E. V., Genkin A. A. Aplicación de criterios estadísticos no paramétricos en la investigación biomédica. - L., 1973.
  • Sidorenko E.V. Métodos de procesamiento matemático en psicología. - San Petersburgo, 2002.

Fundación Wikimedia. 2010.

  • U-954
  • Punto U de mujer

Vea qué es la “prueba U de Mann-Whitney” en otros diccionarios:

    Prueba de Mann Whitney- - Temas de telecomunicaciones, conceptos básicos ES Mann Whitney U test... Guía del traductor técnico

    Prueba de Mann-Whitney

    Prueba de Mann-Whitney-Wilcoxon- La prueba U de Mann Whitney es una prueba estadística no paramétrica que se utiliza para evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar diferencias de significado... Wikipedia

    Prueba de Mann-Whitney-Wilcoxon- La prueba U de Mann Whitney es una prueba estadística no paramétrica que se utiliza para evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar diferencias de significado... Wikipedia

    Prueba U de Mann- La prueba U de Mann Whitney es una prueba estadística que se utiliza para evaluar las diferencias entre dos muestras independientes en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar... ... Wikipedia

    Prueba U de Mann-Whitney- (Prueba U de Mann Whitney en inglés) una prueba estadística no paramétrica utilizada para evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar diferencias en el valor de un parámetro entre pequeños ... Wikipedia

    Prueba de bondad de ajuste de Kolmogorov- o la prueba de bondad de ajuste de Kolmogorov Smirnov es una prueba estadística que se utiliza para determinar si dos distribuciones empíricas obedecen la misma ley o si la distribución resultante obedece al modelo supuesto.... ... Wikipedia

    criterio de Kruskal- Wallis está diseñado para probar la igualdad de medianas de varias muestras. Este criterio es una generalización multidimensional de la prueba de Wilcoxon-Mann-Whitney. El criterio de Kruskal Wallis es un criterio de rango, por lo que es invariante con respecto a cualquier... ... Wikipedia

    criterio de Cochran- La prueba de Cochran se utiliza cuando se comparan tres o más muestras del mismo tamaño. La discrepancia entre las varianzas se considera aleatoria en el nivel de significancia seleccionado si: ¿dónde está el cuantil de la variable aleatoria con el número de sumados... ... Wikipedia

    criterio de wald- (criterio maximin) uno de los criterios para la toma de decisiones en condiciones de incertidumbre. Criterio de pesimismo extremo. Historia El criterio de Wald fue propuesto por Abraham Wald en 1955 para muestras de igual tamaño y luego se amplió a... Wikipedia

El método estadístico actual fue propuesto por Frank Wilcoxon (ver foto) en 1945. Sin embargo, en 1947, H. B. Mann y D. R. Whitney mejoraron y ampliaron el método, razón por la cual la prueba U recibe más a menudo su nombre.

El criterio pretende evaluar las diferencias entre dos muestras en términos del nivel de cualquier atributo medido cuantitativamente. Le permite identificar diferencias entre muestras pequeñas cuando n 1, n 2 ≥3 o n 1 =2, n 2 ≥5, y es más potente que la prueba de Rosenbaum.

Descripción de la prueba U de Mann-Whitney

Hay varias formas de utilizar el criterio y varias opciones para tablas de valores críticos correspondientes a estos métodos (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ).

Este método determina si el área de valores de cruce entre dos series es lo suficientemente pequeña. Recordamos que llamamos a la 1ª fila (muestra, grupo) la fila de valores en la que los valores, según estimaciones preliminares, son mayores, y a la 2ª fila es aquella donde supuestamente son menores.

Cuanto menor sea el área de valores superpuestos, más probable es que las diferencias sean significativas. A veces se hace referencia a estas diferencias como diferencias en la ubicación de las dos muestras (Welkowitz J. et al., 1982).

El valor empírico del criterio U refleja qué tan grande es el área de acuerdo entre las filas. Por lo tanto, cuanto menor sea U em, más probable es que las diferencias sean significativas.

Hipótesis de la U - Prueba de Mann-Whitney

H 0: El nivel del rasgo en el grupo 2 no es inferior al nivel del rasgo en el grupo 1.
H 1: El nivel del rasgo en el grupo 2 es menor que el nivel del rasgo en el grupo 1.

Limitaciones de la prueba U de Mann-Whitney

1. Cada muestra debe tener al menos 3 observaciones: n 1,n 2 ≥ Z; Se permite que en una muestra haya 2 observaciones, pero luego en la segunda debe haber al menos 5.

2. Cada muestra no deberá contener más de 60 observaciones; norte 1, norte 2 ≤ 60.

Cálculo automático de la prueba U de Mann-Whitney

Paso 1

Ingrese los datos de la primera muestra en la primera columna (“Muestra 1”) y los datos de la segunda muestra en la segunda columna (“Muestra 2”). Los datos se ingresan un número por línea; sin espacios, omisiones, etc. Sólo se ingresan números. Los números fraccionarios se ingresan con un "." (punto). Después de completar las columnas, haga clic en el botón "Paso 2" para calcular automáticamente la prueba U de Mann-Whitney.