Red de conocimiento del abogados - Ley de patentes - Algoritmo de modelado matemático (31) Análisis de varianza (Parte 1)

Algoritmo de modelado matemático (31) Análisis de varianza (Parte 1)

Hemos realizado dos pruebas de hipótesis sobre la media general, como por ejemplo si los tamaños de las piezas producidas por dos máquinas herramienta son iguales y si ciertos indicadores fisiológicos de pacientes y personas normales son iguales. Si generalizamos este tipo de problema y probamos si las medias de dos o más poblaciones son iguales entre sí, todavía es difícil hacerlo usando el método presentado anteriormente. En la producción y la vida real, se pueden citar muchas preguntas de este tipo: de las bombillas fabricadas mediante varios procesos diferentes, se toman algunas para medir su vida útil y se quiere inferir si la vida útil de las bombillas fabricadas mediante estos procesos es larga. Diferencias significativas; al utilizar varios fertilizantes químicos y varias variedades de trigo para cultivar trigo en varios campos experimentales, es necesario inferir si los diferentes fertilizantes químicos y variedades tienen un impacto significativo en el rendimiento.

Los resultados de la prueba que interesan a la gente se denominan indicadores. Las condiciones que deben examinarse y controlarse en la prueba se denominan factores o factores. El estado de los factores se denomina nivel. El problema de la vida del bulbo mencionado anteriormente es un experimento de un solo factor y el problema del rendimiento del trigo es un experimento de dos factores. Los métodos estadísticos para procesar los resultados de estas pruebas se denominan análisis de varianza unidireccional y análisis de varianza bidireccional.

Considere solo el impacto de un factor en el índice de preocupación, seleccione varios niveles y realice varios experimentos en cada nivel Durante el proceso de prueba, excepto otros factores que afectan el índice, permanecen sin cambios (solo. aleatorio (el factor existe), nuestra tarea es inferir de los resultados experimentales si los factores tienen un impacto significativo en los indicadores, es decir, si existe una diferencia significativa en los indicadores al tomar diferentes niveles.

Tomar un indicador de un determinado nivel como variable aleatoria y juzgar si existe una diferencia significativa en los indicadores de diferentes niveles equivale a probar si las medias de varias poblaciones son iguales.

Llama a la enésima fila al enésimo grupo de datos. Para determinar si cada nivel de tiene un impacto significativo en el indicador equivale a realizar la siguiente prueba de hipótesis:

No todos son iguales.

Dado que el valor de se ve afectado no solo por diferentes niveles de , sino también por factores aleatorios en condiciones fijas, se descompone en:

Entre ellos, y son independientes entre sí.

Nota:

es la media general y es el efecto del nivel sobre el indicador. El modelo de (1) y (2) se puede expresar como:

La hipótesis nula es (la hipótesis alternativa se omitirá de ahora en adelante):

Nota:

es el primero. La media del grupo de los datos del grupo es la media general. Examine la suma de las desviaciones al cuadrado de todos los pares de datos:

Después de la descomposición, podemos obtener:

Nota:

Entonces:

Tenga en cuenta que es el total multiplicado por la varianza de la muestra, entonces tenemos:

De la aditividad de la distribución:

Es decir:

Y tenemos:

Se puede obtener un análisis más detallado:

Si es cierto, entonces:

Cuando no es cierto, esta relación será mucho mayor que 1. Cuando se establece, la relación obedece a la distribución de grados de libertad, es decir:

es la prueba, dado el nivel de significancia, el cuantil de la distribución se registra como, y la regla de la prueba es:

Aceptar cuando sea necesario, rechazar en caso contrario.

El análisis anterior es equivalente al análisis de varianza entre grupos y dentro de grupos, por lo que este método de prueba de hipótesis se denomina análisis de varianza.

Organice los datos de la prueba de acuerdo con el análisis anterior y los resultados del cálculo en la forma de la Tabla 2, que se denomina tabla de análisis de varianza de un factor (tabla de análisis de varianza proporcionada en Matlab).

La última columna da la probabilidad de que un valor mayor que sea equivalente a .

El comando para el análisis de varianza unidireccional en la caja de herramientas estadísticas de Matlab es anoval.

El uso del procesamiento de datos balanceados es:

El valor de retorno es una probabilidad. En ese momento, se acepta que es la matriz de datos y cada columna es un nivel de. datos (muestras en cada nivel aquí capacidad). Además, se generan una tabla de varianza y un

diagrama de caja.

Escribe el programa de la siguiente manera:

Matlab generará una tabla de análisis de varianza:

Obtener, entonces aceptar, es decir, no hay diferencia significativa en el productividad de 5 trabajadores. La tabla de varianza corresponde a las columnas 1 a 4 de la tabla de análisis de varianza unifactorial anterior, que es el cuantil de la distribución. Se puede verificar:

Al mismo tiempo, el programa generará un cuadro. trama.

El uso del procesamiento de datos no uniformes es:

x es un vector, ordenado desde el primer grupo hasta el r-ésimo grupo de datos es un vector con el mismo; longitud como x, marcando el centro de x Grupo de datos (ingrese un número entero en la posición correspondiente al x-ésimo grupo de datos).

Solución: Escriba el siguiente programa

para obtener , por lo que existen diferencias significativas en la vida útil de las bombillas fabricadas mediante varios procesos.

En el problema de la vida útil de las bombillas, para determinar qué procesos tienen diferencias significativas en la vida útil de las bombillas, primero calculamos la media de cada conjunto de datos:

Aunque el La media es la más grande. Para juzgar que es significativamente diferente de otros tipos, se necesitan múltiples comparaciones. Generalmente, las comparaciones múltiples requieren comparaciones por pares de todas las poblaciones para analizar las diferencias entre ellas. El número de comparaciones se puede reducir dependiendo de las circunstancias específicas del problema.

Para el problema anterior, el programa de comparación múltiple de Matlab es: