Estadísticas descriptivas de Mann Whitney. Cálculo mediante el método de Mann-Whitney
![](https://i2.wp.com/sdamzavas.net/imgbaza/baza4/927535265358.files/image006.gif)
Determinar si los estudiantes 7 "B" son superiores a los estudiantes 7 "A" en términos de conocimientos en matemáticas.
Una comparación de los resultados muestra que las puntuaciones recibidas en la prueba en el séptimo grado "B" son ligeramente más altas, por lo que consideramos primero la muestra de resultados del séptimo grado "B". Por tanto, es necesario determinar si la diferencia existente entre las puntuaciones puede considerarse significativa. Si es posible, esto significará que la clase que estudia bajo el sistema de “educación para el desarrollo” tendrá mejores conocimientos en matemáticas. De lo contrario, al nivel de significancia seleccionado la diferencia será insignificante.
Para evaluar las diferencias entre dos muestras pequeñas (en este ejemplo, sus volúmenes son iguales: n 1 =12, n 2 =11), utilizamos la prueba de Mann-Whitney. Clasifiquemos la tabla presentada:
7 "B" (puntos) | rango | 7 "A" (puntos) | rango |
22,5 | |||
22,5 | 20.5 | ||
20.5 | 16.5 | ||
16.5 | 16.5 | ||
16.5 | 11.5 | ||
16.5 | 11.5 | ||
16.5 | 7.5 | ||
11.5 | 7.5 | ||
11.5 | 7.5 | ||
7.5 | 4.5 | ||
4.5 | |||
Suma: | 168.5 | Suma: | 107.5 |
Al clasificar, combinamos dos muestras en una. Los rangos se asignan en orden ascendente del valor de la cantidad medida, es decir el rango más bajo corresponde a la puntuación más baja. Tenga en cuenta que si las puntuaciones de varios estudiantes coinciden, el rango de dicha puntuación debe considerarse como la media aritmética de las posiciones ocupadas por estas puntuaciones cuando se organizan en orden ascendente. Por ejemplo, 3 estudiantes recibieron 4 puntos (ver tabla). Esto significa que las 3 primeras posiciones del ordenamiento serán ocupadas por una puntuación igual a 4. Por lo tanto, la clasificación para 4 puntos es la media aritmética de las posiciones 1, 2 y 3, o: . Razonamos de manera similar al calcular la clasificación para una puntuación igual a 5. Dos estudiantes recibieron esta puntuación. Esto significa que distribuidos en orden ascendente, las tres primeras posiciones las ocuparán una puntuación igual a 4, y las posiciones cuarta y quinta estarán ocupadas por una puntuación igual a 5. Por tanto, su rango será igual a la media aritmética entre los números 4 y 5, es decir 4.5.
Utilizando el principio de clasificación propuesto, obtenemos una tabla de clasificaciones. Tenga en cuenta que la elección de la media aritmética como rango se utiliza para cualquier clasificación, incluida la necesaria para calcular otros criterios de confiabilidad o el coeficiente de correlación de Spearman.
Para utilizar la prueba de Mann-Whitney, calculamos las sumas de rangos de las muestras consideradas (ver tabla). La suma de la primera muestra es 168,5, de la segunda, 107,5. Denotemos la mayor de estas sumas por T x (T x =168,5). Entre los volúmenes de muestras n 1 y n 2, denotamos el mayor como n x . Estos datos son suficientes para utilizar la fórmula para calcular el valor empírico del criterio:
T x =168,5, n x =12>11=n 2. Entonces:
Encontramos el valor crítico del criterio utilizando una tabla especial. Sea el nivel de significancia 0,05.
Se acepta la hipótesis H 0 sobre la insignificancia de las diferencias entre las puntuaciones de dos clases si u cr
Por tanto, las diferencias en el nivel de conocimientos matemáticos entre los estudiantes pueden considerarse insignificantes.
El esquema para utilizar la prueba de Mann-Whitney es el siguiente
El criterio pretende evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente, con una variante de distribución diferente de normal. Además, nos permite identificar diferencias entre pequeñas muestras(cuando n 1, n 2 ³3 o n 1 =2, n 2 ³5). Este método determina qué tan débilmente se superponen (coinciden) los valores entre dos muestras. Cuantos menos valores se superpongan, más probable será que las diferencias sean significativas.
Cuanto menor sea Uem, más probable es que las diferencias sean significativas.
Hipótesis nula: el nivel del rasgo en la muestra 2 no es inferior al nivel del rasgo en la muestra 1.
Antes de evaluar el criterio Ud. Es necesario hacer una clasificación.
DEFINICIÓN: que van – distribución de variantes dentro de la serie de variaciones de valores menores a mayores.
Reglas de clasificación:
1. Al valor más pequeño se le asigna un rango inferior, generalmente es 1. Al valor más grande se le asigna un rango correspondiente al número de valores clasificados (si n = 10, entonces el valor más grande recibirá un rango de 10).
2. Si varios valores son iguales, se les asigna un rango que es el promedio de los rangos que recibirían si no fueran iguales:
3. La suma total de rangos debe coincidir con la calculada, que viene determinada por la fórmula: , donde N es el número total de valores clasificados. Una discrepancia entre las sumas de rangos reales y calculadas indicará un error cometido al calcular los rangos o resumirlos. Antes de continuar, debes encontrar el error y solucionarlo.
Ejemplo.
Clasifiquemos la siguiente fila.
Utilizando la fórmula, comprobaremos la exactitud de la clasificación.
. Determinemos la suma de rangos: 1+2,5+2,5+4+5+6+7=28.
La suma total de rangos coincide con la calculada. Por lo tanto, clasificamos correctamente.
Esquema de cálculo del criterio de Mann-Whitney:
![](https://i1.wp.com/konspekta.net/studopediaru/baza19/2248026649375.files/image068.gif)
Cuanto menor sea el valor Ud., mayor es la confiabilidad de las diferencias y mayor la confianza para rechazar la hipótesis nula.
3 ejemplo.
En las enfermedades de la retina, aumenta la permeabilidad de sus vasos. Los investigadores midieron la permeabilidad vascular de la retina en personas sanas y en pacientes con daño retiniano. Los resultados obtenidos se muestran en la tabla.
Probar si estos datos apoyan la hipótesis de diferencias en la permeabilidad vascular de la retina.
Hipótesis nula : la permeabilidad de los vasos retinianos en enfermedades de la retina en pacientes no es mayor que en los sanos (no hay diferencia estadística entre las dos muestras).
Hipótesis alternativa : la permeabilidad de los vasos retinianos en pacientes con enfermedades de la retina es mayor que en los sanos (existe una diferencia estadística entre las dos muestras).
Saludable | enfermo | ||||
Número de serie | Rango | permeabilidad vascular de la retina | Número de serie | Rango | |
0,5 | 1,2 | 6,5 | |||
0,7 | 2,5 | 1,4 | |||
0,7 | 2,5 | 1,6 | |||
1,0 | 4,5 | 1,7 | |||
1,0 | 4,5 | 1,7 | |||
1,2 | 6,5 | 1,8 | |||
1,4 | 2,2 | 18,5 | |||
1,4 | 2,3 | ||||
1,6 | 2,4 | ||||
1,6 | 6,4 | ||||
1,7 | |||||
2,2 | 18,5 | 23,6 | |||
Prueba U de Mann-Whitney
Finalidad del criterio. El criterio pretende evaluar las diferencias entre dos muestras por nivel cualquier característica medida cuantitativamente. Le permite identificar diferencias entre pequeño muestras cuando PAG 1, pág 2 > 3 o norte L = 2, norte 2 > 5, y es más poderoso que el criterio. q Rosenbaum.
Este método determina si el área de valores de cruce entre dos series es lo suficientemente pequeña. Recordamos que llamamos a la 1ª fila (muestra, grupo) la fila de valores en la que los valores, según estimaciones preliminares, son mayores, y a la 2ª fila es aquella donde supuestamente son menores.
Cuanto menor sea el área de valores cruzados, más probable es que diferencias confiable. Estas diferencias a veces se denominan diferencias en ubicación dos muestras. El valor empírico del criterio refleja qué tan grande es la zona de coincidencia entre las filas. Es por eso lo menos t/ 3Mn, especialmente es probable que las diferencias confiable.
Hipótesis.
El nivel de inteligencia no verbal en el grupo de estudiantes de física es mayor que en el grupo de estudiantes de psicología.
Representación gráfica del criterio.Ud. Papá Fig. La figura 7.25 presenta tres de las muchas opciones posibles para la relación entre dos series de valores.
En la opción (a), la segunda fila es más baja que la primera y las filas apenas se cruzan. Área de superposición ( S j) demasiado pequeño para ocultar las diferencias entre filas. Existe la posibilidad de que las diferencias entre ellos sean confiables. Podemos determinar esto con precisión utilizando el criterio. Ud.
En la opción (b), la segunda fila también es más baja que la primera, pero el área de valores que se cruzan en las dos filas es bastante extensa (5 2). Es posible que aún no alcance un valor crítico, cuando las diferencias deberán considerarse insignificantes. Pero sólo puede determinarse si esto es así calculando con precisión el criterio Ud.
En la opción (c), la segunda fila es más baja que la primera, pero el área de superposición es tan amplia (5 3) que las diferencias entre las filas quedan ocultas.
Arroz. 7.25.
en dos muestras
Nota. La superposición (5 t, S 2, *$з) indica áreas de posible superposición. Limitaciones del criterioUd.
- 1. Cada muestra deberá tener al menos tres observaciones: norte v p 2 > 3; Se permite que en una muestra haya dos observaciones, pero luego en la segunda debe haber al menos 5 de ellas.
- 2. Cada muestra no deberá contener más de 60 observaciones; p l, p 2 u, p 2 > 20 la clasificación se vuelve bastante laboriosa.
Volvamos a los resultados de una encuesta a estudiantes de las facultades de física y psicología de la Universidad de Leningrado utilizando la metodología de D. Wexler para medir la inteligencia verbal y no verbal. Usando criterio q Rosenbaum determinó con alto nivel de significancia que el nivel de inteligencia verbal en la muestra de estudiantes de la Facultad de Física era mayor. Intentemos ahora establecer si este resultado se reproduce al comparar muestras según el nivel de inteligencia no verbal. Los datos se muestran en la tabla.
2 es inferior al nivel de la característica en la muestra 1 en un nivel confiablemente significativo. Cuanto menor sea el valor tú, mayor será la confiabilidad de las diferencias.
Ahora hagamos todo este trabajo basándonos en nuestro ejemplo. Como resultado de trabajar en los pasos 1 a 6 del algoritmo, crearemos una tabla (Tabla 7.4).
Tabla 7.4
Cálculo de sumas de rangos para muestras de estudiantes de las facultades de física y psicología.
estudiantes de fisica (PAG = 14) |
estudiantes de psicologia (n= 12) |
||
Índice de inteligencia no verbal |
|||
Promedio 107,2 |
Suma total de rangos: 165 + 186 = 351. La suma calculada según la fórmula (5.1) es la siguiente:
![](https://i1.wp.com/studme.org/htm/img/20/1520/59.png)
Se mantiene la igualdad entre importes reales y calculados. Vemos que en términos del nivel de inteligencia no verbal, la muestra de estudiantes de psicología ocupa un lugar más alto. Es esta muestra la que representa la gran suma de clasificación: 186. Ahora estamos listos para formular hipótesis estadísticas:
I 0: el grupo de estudiantes de psicología no supera al grupo de estudiantes de física en términos de inteligencia no verbal;
I: un grupo de estudiantes de psicología es superior a un grupo de estudiantes de física en términos de inteligencia no verbal.
De acuerdo con el siguiente paso del algoritmo, determinamos el valor empírico. Ud. :
Porque en nuestro caso p l * p 2, calculemos el valor empírico Ud. y para la suma de segundo rango (165), sustituyendo en la fórmula (7.4) su correspondiente px.:
![](https://i0.wp.com/studme.org/htm/img/20/1520/61.png)
Utilizando el Apéndice 8, determinamos los valores críticos para p l = 14, norte 2 = 12:
Recordamos que el criterio Ud. es una de las dos excepciones a la regla general para decidir la confiabilidad de las diferencias, es decir, podemos establecer diferencias significativas si (/ em Ukp 0 05 (en ^amp = 60, y shp > U Kf) o.05).
Por eso, H 0 Se acepta de la siguiente manera: un grupo de estudiantes de psicología no supera a un grupo de estudiantes de física en cuanto al nivel de inteligencia no verbal.
Tenga en cuenta que para este caso, el criterio Q de Rosenbaum no es aplicable, ya que el rango de variabilidad en el grupo de físicos es más amplio que en el grupo de psicólogos: tanto los valores más altos como los más bajos de inteligencia no verbal ocurren en el grupo de físicos (ver Tabla 7.4).
Por el nivel de cualquier atributo, medido cuantitativamente. Le permite identificar diferencias en los valores de los parámetros entre muestras pequeñas.
Otros nombres: prueba de Mann-Whitney-Wilcoxon Mann-Whitney-Wilcoxon, MWW ), prueba de suma de rangos de Wilcoxon (ing. Prueba de suma de rangos de Wilcoxon) o prueba de Wilcoxon-Mann-Whitney (ing. Prueba de Wilcoxon-Mann-Whitney ).
Historia
Este método para identificar diferencias entre muestras fue propuesto en 1945 por Frank Wilcoxon ( F. Wilcoxon). En 1947 fue revisado y ampliado sustancialmente por H. B. Mann ( HB Mann) y D. R. Whitney ( DR Whitney), por cuyos nombres hoy se le suele llamar.
Descripción del criterio
Prueba no paramétrica simple. La potencia de la prueba es mayor que la de la prueba Rosenbaum Q.
Este método determina si el área de valores superpuestos entre dos series (una serie clasificada de valores de parámetros en la primera muestra y los mismos en la segunda muestra) es lo suficientemente pequeña. Cuanto menor sea el valor del criterio, más probable será que las diferencias entre los valores de los parámetros en las muestras sean confiables.
Limitaciones a la aplicabilidad del criterio
- Cada muestra debe tener al menos 3 valores característicos. Se permite que en una muestra haya dos valores, pero luego en la segunda haya al menos cinco.
- No debe haber valores coincidentes en los datos de muestra (todos los números son diferentes) o muy pocas coincidencias.
Usando el criterio
Para aplicar la prueba U de Mann-Whitney, es necesario realizar las siguientes operaciones.
Cálculo automático de la prueba U de Mann-Whitney
tabla de valores críticos
ver también
- La prueba de Kruskal-Wallis es una generalización multivariada de la prueba U de Mann-Whitney.
Literatura
- Mann H. B., Whitney D. R. En una prueba de si una de dos variables aleatorias es estocásticamente mayor que la otra. // Anales de estadística matemática. - 1947. - No. 18. - P. 50-60.
- Wilcoxon F. Comparaciones individuales por métodos de clasificación. // Boletín de Biometría 1. - 1945. - P. 80-83.
- Gubler E. V., Genkin A. A. Aplicación de criterios estadísticos no paramétricos en la investigación biomédica. - L., 1973.
- Sidorenko E.V. Métodos de procesamiento matemático en psicología. - San Petersburgo, 2002.
Fundación Wikimedia. 2010.
- U-954
- Punto U de mujer
Vea qué es la “prueba U de Mann-Whitney” en otros diccionarios:
Prueba de Mann Whitney- - Temas de telecomunicaciones, conceptos básicos ES Mann Whitney U test... Guía del traductor técnico
Prueba de Mann-Whitney
Prueba de Mann-Whitney-Wilcoxon- La prueba U de Mann Whitney es una prueba estadística no paramétrica que se utiliza para evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar diferencias de significado... Wikipedia
Prueba de Mann-Whitney-Wilcoxon- La prueba U de Mann Whitney es una prueba estadística no paramétrica que se utiliza para evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar diferencias de significado... Wikipedia
Prueba U de Mann- La prueba U de Mann Whitney es una prueba estadística que se utiliza para evaluar las diferencias entre dos muestras independientes en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar... ... Wikipedia
Prueba U de Mann-Whitney- (Prueba U de Mann Whitney en inglés) una prueba estadística no paramétrica utilizada para evaluar las diferencias entre dos muestras en términos del nivel de cualquier característica medida cuantitativamente. Le permite identificar diferencias en el valor de un parámetro entre pequeños ... Wikipedia
Prueba de bondad de ajuste de Kolmogorov- o la prueba de bondad de ajuste de Kolmogorov Smirnov es una prueba estadística que se utiliza para determinar si dos distribuciones empíricas obedecen la misma ley o si la distribución resultante obedece al modelo supuesto.... ... Wikipedia
criterio de Kruskal- Wallis está diseñado para probar la igualdad de medianas de varias muestras. Este criterio es una generalización multidimensional de la prueba de Wilcoxon-Mann-Whitney. El criterio de Kruskal Wallis es un criterio de rango, por lo que es invariante con respecto a cualquier... ... Wikipedia
criterio de Cochran- La prueba de Cochran se utiliza cuando se comparan tres o más muestras del mismo tamaño. La discrepancia entre las varianzas se considera aleatoria en el nivel de significancia seleccionado si: ¿dónde está el cuantil de la variable aleatoria con el número de sumados... ... Wikipedia
criterio de wald- (criterio maximin) uno de los criterios para la toma de decisiones en condiciones de incertidumbre. Criterio de pesimismo extremo. Historia El criterio de Wald fue propuesto por Abraham Wald en 1955 para muestras de igual tamaño y luego se amplió a... Wikipedia
El método estadístico actual fue propuesto por Frank Wilcoxon (ver foto) en 1945. Sin embargo, en 1947, H. B. Mann y D. R. Whitney mejoraron y ampliaron el método, razón por la cual la prueba U recibe más a menudo su nombre.
El criterio pretende evaluar las diferencias entre dos muestras en términos del nivel de cualquier atributo medido cuantitativamente. Le permite identificar diferencias entre muestras pequeñas cuando n 1, n 2 ≥3 o n 1 =2, n 2 ≥5, y es más potente que la prueba de Rosenbaum.
Descripción de la prueba U de Mann-Whitney
Hay varias formas de utilizar el criterio y varias opciones para tablas de valores críticos correspondientes a estos métodos (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ).
Este método determina si el área de valores de cruce entre dos series es lo suficientemente pequeña. Recordamos que llamamos a la 1ª fila (muestra, grupo) la fila de valores en la que los valores, según estimaciones preliminares, son mayores, y a la 2ª fila es aquella donde supuestamente son menores.
Cuanto menor sea el área de valores superpuestos, más probable es que las diferencias sean significativas. A veces se hace referencia a estas diferencias como diferencias en la ubicación de las dos muestras (Welkowitz J. et al., 1982).
El valor empírico del criterio U refleja qué tan grande es el área de acuerdo entre las filas. Por lo tanto, cuanto menor sea U em, más probable es que las diferencias sean significativas.
Hipótesis de la U - Prueba de Mann-Whitney
H 0: El nivel del rasgo en el grupo 2 no es inferior al nivel del rasgo en el grupo 1.
H 1: El nivel del rasgo en el grupo 2 es menor que el nivel del rasgo en el grupo 1.
Limitaciones de la prueba U de Mann-Whitney
1. Cada muestra debe tener al menos 3 observaciones: n 1,n 2 ≥ Z; Se permite que en una muestra haya 2 observaciones, pero luego en la segunda debe haber al menos 5.
2. Cada muestra no deberá contener más de 60 observaciones; norte 1, norte 2 ≤ 60.
Cálculo automático de la prueba U de Mann-Whitney
Paso 1
Ingrese los datos de la primera muestra en la primera columna (“Muestra 1”) y los datos de la segunda muestra en la segunda columna (“Muestra 2”). Los datos se ingresan un número por línea; sin espacios, omisiones, etc. Sólo se ingresan números. Los números fraccionarios se ingresan con un "." (punto). Después de completar las columnas, haga clic en el botón "Paso 2" para calcular automáticamente la prueba U de Mann-Whitney.