Los investigadores generan muestras al azar con el fin de que sean representativas de la población. El muestreo aleatorio es importante porque los efectos experimentales observados sobre las muestras al alar, pueden generalizarse a la población de la cual se extrajeron las muestras.
Una distribución de muestreo es una distribución de la probabilidad teórica de algún estadígrafo calculado para un gran número de muestras al azar de tamaño N, extraídas de una población. Algunos ejemplos son la media y las distribuciones de muestreo t.
El estadígrafo t se calcula para dos muestras con el propósito básico de que refleje diferencias en las tendencias centrales de las muestras. La distribución de muestreo t varía según el tamaño de las muestras.
En un experimento con un grupo control y un grupo experimental, se administra el procedimiento control a una muestra de sujetos, y el procedimiento experimental a la otra muestra. Si se han extraído muestras de sujetos al azar, es probable que las distribuciones de la ejecución de las dos muestras en la variable independiente, antes de iniciar el experimento, no sólo sean similares entre sí, sino también semejantes a la distribución de la población; sin embargo, hay también una pequeña probabilidad de que las muestras aleatorias sean notablemente diferentes, sólo por factores de azar. Después de la administración de los tratamientos, las ejecuciones de las muestras pueden ser bastante diferentes por otra razón distinta a saber: la efectividad del tratamiento experimental
La tarea del investigador es determinar si la diferencia entre los grupos se debió al azar o al efecto del tratamiento experimental. los investigadores emplean el estadígrafo t para apoyar su decisión entre esas dos alternativas. Cuando comparado con la distribución de muestreo t, encontramos que el estadígrafo calculado de t presenta una probabilidad asociada de .05, o menos, los investigadores infieren que las diferencias muestrales se debieron al tratamiento experimental. Si las probabilidades asociadas son mayores que .05, los investigadores infieren que la diferencia se debió al azar. El nivel de probabilidad de .05 se conoce de ordinario como el nivel de significación.
Las diferencias aleatorias entre las muestras, corresponden a lo que se denomina hipótesis de nulidad. La diferencia que se debe al tratamiento experimental corresponde a lo que se ha llamado hipótesis alternativa. Cuando el nivel de probabilidad del estadígrafo calculado de t es de .05 o menos, se acepta la hipótesis alternativa; de lo contrario, se acepta la hipótesis de nulidad.
Los investigadores pueden formular tres tipos de hipótesis alternativas antes de iniciar un experimento. En primer lugar, que el grupo de control mostrará una ejecución numéricamente mayor que la del grupo experimental; la segunda puede expresar lo contrario. La tercera puede predecir simplemente que se encontrará una diferencia: sin especificar la dirección. Las primeras dos predicciones requieren una prueba unidireccional y la tercera, una prueba bidireccional. La prueba unidireccional se realiza en uno u otro de los extremos de la distribución de muestreo t. La prueba bidireccional permite probar los resultados en ambos extremos de la distribución de muestreo.
Aunque el nivel de probabilidad de .05 o menos sugiere que el tratamiento experimental explica las diferencias entre los grupos, también define la probabilidad de que las diferencias entre los grupos se deban al azar. Por lo tanto es un asunto de la probabilidad el que la aceptación de la hipótesis alternativa sea errónea. Este error se ha denominado Error de Tipo I.
Los investigadores cuentan con dos clases de estadígrafos t. El uno es apropiado para situaciones en las cuales se asigna un tratamiento (por ejemplo, el tratamiento control) a un grupo, y el otro tratamiento (por ejemplo, el tratamiento experimental) al otro grupo; la otra forma es adecuada para las situaciones en las cuales todos los tratamientos se administran a un grupo de sujetos. El estadígrafo t apropiado para la primera situación se denomina estadígrafo t para grupos independientes y el estadígrafo t apropiado para la segunda circunstancia se llama estadígrafo t para grupos dependientes.
El análisis de varianza (ANOVA) se emplea en las situaciones en las cuales se aplican tres o más tratamientos. Después de aplicado un ANOVA se hacen comparaciones apareadas entre las series de datos mediante pruebas tales como la de Newman-Keuls.
Las pruebas estadísticas pueden ser paramétricas o no-paramétricas. Las pruebas paramétricas tienen más restricciones con respecto a su aplicación. Las pruebas para métricas tales como la prueba t y el ANOVA, requieren que las distribuciones de la población sean aproximadamente normales y con una varianza más o menos semejante. Las pruebas no-paramétricas deben emplearse cuando las datos no satisfacen los presupuestos de las pruebas paramétricas.
El criterio para la selección de una prueba estadística incluye los supuestos de la prueba, el número de variables independientes en el diseño del experimento, el número de condiciones de la(s) variable(s) independiente(s) que se hicieron variar en el experimento y la consideración de si los datos son dependientes o independientes.
Cuando los procedimientos estadísticos son complejos, extensos o voluminosos, se recomienda hacer dicho análisis por computador.
Bibliografía
Arnau, J., (1980), Psicología Experimental. Un enfoque Metodológico, México: Editorial Trillas, S. A.
Deja una respuesta