- Educación
- Matemáticas
- Estadísticas
- Cómo realizar una prueba para detectar una diferencia promedio utilizando la prueba t emparejada
Libro Relacionado
Por Deborah J. Rumsey
Puede probar una diferencia promedio usando la prueba t emparejada cuando la variable es numérica (por ejemplo, ingresos, nivel de colesterol o millas por galón) y los individuos en la muestra estadística están emparejados de alguna manera de acuerdo con variables relevantes como la edad o quizás el peso, o las mismas personas son utilizadas dos veces (por ejemplo, usando una prueba previa y una prueba posterior).
Las pruebas emparejadas se usan típicamente para estudios en los que alguien está probando para ver si un nuevo tratamiento, técnica o método funciona mejor que un método existente, sin tener que preocuparse por otros factores acerca de los sujetos que pueden influir en los resultados.
Con la diferencia promedio, se emparejan los sujetos para que se piense que provienen de una sola población, y el conjunto de diferencias medidas para cada sujeto (por ejemplo, antes y después de la prueba) se piensa que es una muestra. La prueba de hipótesis se reduce entonces a una prueba para una media de población.
Por ejemplo, supongamos que un investigador quiere ver si enseñar a los estudiantes a leer usando un juego de computadora da mejores resultados que enseñar con un método de fonética probado y verdadero. Ella selecciona al azar a 20 estudiantes y los pone en 10 pares de acuerdo a su nivel de preparación para la lectura, edad, coeficiente intelectual, etc. Selecciona al azar a un estudiante de cada pareja para que aprenda a leer mediante el método de juego de ordenador (MC abreviado), y el otro de la pareja aprende a leer mediante el método de fonética (MC abreviado). Al final del estudio, cada estudiante toma el mismo examen de lectura. Los datos se muestran en la siguiente tabla.
Partituras de lectura para Computer Game Method
versus Phonics MethodStudent PairComputer MethodPhonics MethodDifference (CM – PM)18580+528080039588+748790-357872+668279+375750+786973-497378-5109995+4Los
datos originales están en pares, pero usted está realmente interesado sólo en la diferencia en las puntuaciones de lectura (puntuación de lectura de la computadora menos puntuación de lectura de la fonética) para cada par, no en las puntuaciones de lectura en sí. Así que las diferencias emparejadas (las diferencias en los pares de puntuaciones) son su nuevo conjunto de datos. Puede ver sus valores en la última columna de la tabla.
Al examinar las diferencias en los pares de observaciones, en realidad sólo se dispone de un único conjunto de datos, y sólo se dispone de una prueba de hipótesis para una media de población. En este ejemplo específico, la hipótesis nula es que la media (de las diferencias emparejadas) es 0, y la hipótesis alternativa es que la media (de las diferencias emparejadas) es mayor que 0.
Si los dos métodos de lectura son los mismos, el promedio de las diferencias emparejadas debe estar cerca de 0. Si el método de la computadora es mejor, el promedio de las diferencias emparejadas debe ser significativamente mayor que 0; es decir, la puntuación de la lectura en la computadora debe ser mayor que la puntuación de la fonética.
La notación para la hipótesis nula es
(La d en el subíndice sólo le recuerda que está trabajando con las diferencias emparejadas.)
La fórmula para el estadístico de la prueba para las diferencias apareadas es la siguiente
y tn-1 es un valor en la distribución t con nd- 1 grados de libertad.
Se utiliza una distribución t porque en la mayoría de los experimentos de pares mate el tamaño de la muestra es pequeño y/o la desviación estándar de la población.
es desconocido, así que es estimado por sd.
Para calcular el estadístico de la prueba para las diferencias de pares, haga lo siguiente:
- Para cada par de datos, tome el primer valor del par menos el segundo valor del par para encontrar la diferencia emparejada.
- Calcular la media y la desviación estándar, sd, de todas las diferencias.
- Dejando y representando el número de diferencias emparejadas que tiene, calcule el error estándar:
- Divida por el error estándar del paso 3.
Porque
es igual a 0 si H0 es verdadero, realmente no necesita ser incluido en la fórmula de la estadística de la prueba. Como resultado, a veces se ve la estadística de la prueba escrita de esta manera:
Para el ejemplo de las puntuaciones de lectura, puede utilizar los pasos anteriores para ver si el método informático es mejor para enseñar a los estudiantes a leer.
Para encontrar la estadística, siga estos pasos:
- Calcule las diferencias para cada par (se muestran en la columna 4 de la tabla anterior). Observe que el signo en cada una de las diferencias es importante; indica qué método funcionó mejor para ese par en particular.
- Calcular la media y la desviación estándar de las diferencias de la etapa 1. En este ejemplo, la media de las diferencias es y la desviación estándar es sd = 4,64. Note que nd= 10 aquí.
- El error estándar es (Recuerde que aquí, ndis el número de pares, que es 10.)
- Tome la media de las diferencias (Paso 2) dividida por el error estándar de 1,47 (Paso 3) para obtener 1,36, la estadística de la prueba.
¿Es el resultado del Paso 4 suficiente para decir que la diferencia en las puntuaciones de lectura encontradas en este experimento se aplica a toda la población en general? Porque la desviación estándar de la población,
es desconocido y lo ha estimado con la desviación estándar del muestreo (s), necesita utilizar la distribución t en lugar de la distribución Z para encontrar su valor p. Usando la siguiente tabla t, se busca 1.36 en la distribución t con 10 – 1 = 9 grados de libertad para calcular el valor p.
El valor p en este caso es mayor que 0.10 (y por lo tanto mayor que 0.05) porque 1.36 es menor que (o a la izquierda de) el valor de 1.38 en la tabla, y por lo tanto su valor p es mayor que 0.10 (el valor p para el encabezamiento de la columna correspondiente a 1.38).
Debido a que el valor p es mayor que 0.05, usted no puede rechazar H0; no tiene suficiente evidencia de que la diferencia media en las puntuaciones entre el método de computación y el método de fonética sea significativamente mayor que 0. Sin embargo, eso no significa necesariamente que no haya una diferencia real en la población de todos los estudiantes. Pero el investigador no puede decir que el juego de computadora es un mejor método de lectura basado en esta muestra de 10 estudiantes.
Usted podría preguntarse: «Hey, la media de muestra de las diferencias es 2.0, lo que muestra que el método de la computadora era mejor que el método de la fonética…». ¿Por qué la prueba de hipótesis rechazó H0 si 2.0 es obviamente mayor que 0?» Porque en este caso, 2.0 no es significativamente mayor que 0. También es necesario tener en cuenta la variación utilizando el error estándar y la distribución t para poder decir algo sobre toda la población de estudiantes.