análisis de correlación de Pearson
En el análisis de correlación del software SPSS, ¿cuáles son las similitudes y diferencias entre los tres métodos de análisis de correlación: Pearson, Kendall y Spearman?
Cuando existe una correlación lineal entre dos variables continuas, la Se utiliza el coeficiente de correlación de diferencia de productos de Pearson. Cuando no se cumplen las condiciones aplicables para el análisis de correlación de diferencia de productos, se utiliza el coeficiente de correlación de rango de Spearman para describirlo.
El coeficiente de correlación de Spearman también se denomina correlación de rango. El coeficiente es un análisis de correlación lineal que utiliza los rangos de dos variables. No requiere la distribución de las variables originales. Es un método estadístico no paramétrico y tiene un ámbito de aplicación más amplio. Para datos que obedecen al coeficiente de correlación de Pearson, también se puede calcular el coeficiente de correlación de Spearman, pero la eficiencia estadística es menor. La fórmula de cálculo del coeficiente de correlación de Pearson se puede aplicar completamente a la fórmula de cálculo del coeficiente de correlación de Spearman, pero x e y en la fórmula se pueden reemplazar por los rangos correspondientes.
Coeficiente de correlación de rango tau-b de Kendall: un indicador utilizado para reflejar la correlación de variables categóricas, adecuado para situaciones en las que ambas variables categóricas son categorías ordenadas. Realice una prueba de correlación no paramétrica en variables ordinales relacionadas; el rango de valores está entre -1-1, esta prueba es adecuada para tablas cuadradas
Calcule el coeficiente de correlación de Pearson de distancia del producto, solo se pueden usar variables continuas; utilizado; Calcule el coeficiente de correlación de rango de Spearman, adecuado para variables ordinales o datos equiespaciados que no cumplen con el supuesto de distribución normal; Calcule el coeficiente de correlación de rango de Kendall, adecuado para variables ordinales o datos equiespaciados que no cumplan con el supuesto de distribución normal;
Calcular el coeficiente de correlación: Cuando los datos no obedecen a la distribución normal bivariada o se desconoce la distribución general, o los datos originales se expresan en rangos, es apropiado utilizar la correlación de Spearman o Kendall
Opción de verificación de correlación de Pearson La correlación de diferencia de producto calcula el análisis de correlación entre variables continuas o variables igualmente espaciadas
La correlación de rango de la casilla de verificación de Kendall calcula la correlación de rango entre variables categóricas, adecuada para fusionar datos jerárquicos p>
La correlación de rango de opción múltiple de Spearman calcula la correlación de Spearman, que es adecuada para datos de rango continuo
Nota:
1 Si las variables continuas no son medidas equiespaciadas porque el se desconoce la distribución: se puede utilizar la correlación de rango/también se puede utilizar la correlación de Pearson. La correlación de rango se debe utilizar para variables discretas de rango completo
2 Cuando los datos no obedecen a la distribución normal bivariada o al tipo de distribución general Se desconoce o los datos originales están expresados en rangos, es apropiado utilizar la correlación de Spearman o Kendall.
3 Si el análisis de correlación de rangos de Kendall se utiliza de forma inadecuada, se puede concluir que el coeficiente de correlación es demasiado pequeño. Si se usa incorrectamente, la conclusión puede ser que el coeficiente de correlación es demasiado pequeño o demasiado grande y no se puede examinar la estrecha relación entre diferentes variables. En general, los datos predeterminados obedecen a la distribución normal, por lo que se utiliza el método de análisis de Pearson.
Ingrese Correlación-》Bivariado en SPSS, y habrá 3 opciones en el grupo de casillas de verificación Coeficientes de correlación debajo de las variables:
Pearson
Kendall's tau-b
Spearman: Spearman
Coeficiente de correlación de Spearman (Spearman/Spearman)
La correlación de rangos de Spearman estudia la relación entre dos variables basándose en el método de correlación de datos de rango.
Se calcula en función de la diferencia en el número de cada par de niveles en dos columnas de niveles emparejados, por lo que también se denomina "método de diferencia de niveles".
La correlación de niveles de Spearman no requiere diferencia de producto en los datos. condiciones El coeficiente de correlación es estricto, siempre que los valores observados de las dos variables sean datos de calificación pareados, o los datos de calificación convertidos a partir de datos de observación de variables continuas, se pueden utilizar independientemente de la forma de distribución general. Para el estudio se utilizó dos variables y el tamaño de la muestra.
Coeficiente de correlación de Kendall
El coeficiente W de Kendall, también conocido como coeficiente de armonía, es un método para expresar el grado de correlación de variables jerárquicas de varias columnas. Los datos adecuados para este método generalmente se recopilan mediante el método de calificación, es decir, dejar que K jueces (sujetos) evalúen N cosas, o que un juez (sujeto) evalúe N cosas K veces. Método de evaluación de calificación. Cada evaluador clasifica N cosas en un orden de clasificación. El número de clasificación más pequeño es 1 y el más grande es N. Si las clasificaciones están empatadas, las clasificaciones que deberían estar ocupadas por la misma cosa se dividen en partes iguales, como se suele decir. Dos empatados en el primer lugar, deberían ocupar 1 y 2 lugares, por lo que su nivel debería ser 1.5 Otro ejemplo es un primer lugar, dos empatados en el segundo lugar y tres empatados en el tercer lugar, entonces sus niveles correspondientes deberían ser. 1, 2,5, 2,5, 5, 5, 5, donde 2,5 es el promedio de 2, 3 y 5 es el promedio de 4, 5, 6.
El coeficiente U de Kendall, también conocido como coeficiente de consistencia, es un método que expresa el grado de correlación de variables jerárquicas de varias columnas. Este método también es aplicable a los datos obtenidos al permitir que K jueces (sujetos) evalúen N cosas, o un juez (sujeto) evalúe N cosas K veces sucesivamente. Sin embargo, en la evaluación se utiliza el método de evaluación dual, es decir, cada vez. Una evaluación requiere comparar N cosas en pares. Los resultados de la evaluación se muestran en la siguiente tabla. Los datos completados en los espacios en blanco de la tabla (las áreas sombreadas se pueden ignorar) son: si i es mejor que j, registre 1; i es peor que j, registra 0. , si ambos son iguales, registra 0.5. Un *** obtendrá K de estas tablas. Superponga estas K tablas y los datos en las posiciones correspondientes se acumulan como los datos calculados finales. Estos datos se registran como γij.
Prueba de correlación para distribución normal
La prueba T se suele utilizar para comparar las medias de dos muestras de una población normal. La prueba T requiere que las dos muestras que se comparan provengan de poblaciones normales. La fórmula utilizada para calcular el valor T es diferente cuando las varianzas de las dos muestras son iguales y desiguales.
Utiliza la prueba F para comprobar la homogeneidad de varianzas. La hipótesis nula correspondiente es: las varianzas de los dos grupos de muestras son iguales. Un valor de P inferior a 0,05 indica que la hipótesis nula se rechaza en este nivel y las varianzas son desiguales; de lo contrario, no hay diferencia significativa en las varianzas de los dos grupos;
La prueba U utiliza una cantidad de prueba que obedece a una distribución normal para probar la diferencia en la media poblacional. En este caso normalmente se conoce la varianza poblacional.
Aunque el método de prueba T y el método de prueba U resuelven aproximadamente el mismo problema, el método de prueba U no se puede utilizar cuando la muestra es pequeña (número de muestra n = 30 como muestra grande) y el cuadrado medio el error es desconocido.
Se utilizan diferentes estadísticas para diferentes datos durante la prueba de medias
Utilice el procedimiento MEDIAS para encontrar las estadísticas descriptivas de varios grupos con fines de comparación. Por lo tanto el promedio debe calcularse en grupos. Esto es diferente del proceso Descriptivo.
Para probar si el valor medio de una sola variable es diferente de una constante dada, utilice el proceso de prueba T de una sola muestra.
Para comprobar si dos muestras no relacionadas provienen de la población con la misma media, utilice el proceso de prueba T de muestras independientes para muestras independientes.
Si las muestras agrupadas no son independientes, utilice la prueba T de muestras pareadas.
Si hay más de dos grupos, se debe utilizar el proceso de análisis de varianza ANOVO unidireccional (utilizado para probar si varios grupos independientes provienen de una población con medias iguales) para realizar un análisis de varianza univariado. .
Si las variables que estás intentando comparar claramente no siguen una distribución normal, deberías considerar utilizar una prueba no paramétrica.
Si las variables que estás comparando son categóricas, deberías utilizar la función Tablas cruzadas.
Utilice la prueba unilateral derecha cuando el valor de la muestra no pueda ser negativo.