Estadística aplicada a la investigación en salud
Medwave 2011 Oct;11(10):e5195 doi: 10.5867/medwave.2011.10.5195

Pruebas de hipótesis para comparar dos muestras

Hypothesis testing to compare two samples

Fernando Quevedo Ricardi

Resumen

En la sección Series, Medwave publica artículos relacionados con el desarrollo y discusión de herramientas metodológicas para la investigación clínica, la gestión en salud, la gesión de la calidad y otros temas de interés. En esta edición se presentan dos artículos que forman parte del programa de formación en Medicina Basada en Evidencias que se dicta por e-Campus de Medwave. El artículo siguiente pertenece a la Serie "Estadística Aplicada a la Investigación en Salud".


 

Para desarrollar este tema seguiremos un esquema similar al del capítulo anterior. Estudiaremos tres situaciones problema que, sin ser las únicas, son las más frecuentes.

a) Comparación de la diferencia de promedios de dos muestras independientes.
b) Comparación de promedios de dos muestras pareadas.
c) Comparación de porcentajes de dos muestras.

Las preguntas

Antes de analizar la diferencia entre los promedios muestrales debemos responder algunas preguntas importantes que harán la diferencia en el procedimiento a seguir.

1. ¿Se trata de dos muestras independientes o pareadas?
Diremos que dos muestras son independientes cuando no se establece ninguna relación previa al análisis entre las unidades de una y otra muestra. Por ejemplo, sujetos de uno y otro curso, enfermos de dos consultorios, hombres comparados con mujeres.
En cambio diremos que se trata de muestras pareadas si en forma previa al análisis, se forman parejas entre los individuos de una muestra con los individuos de la otra muestra. Por ejemplo el caso con su control, distintas dietas pueden probarse en dos animales de la misma camada. Sin embargo, cuando queda más clara esta situación es cuando se comparan distintas medidas para los mismos individuos; por ejemplo, al medir antes y después del tratamiento a un mismo grupo de individuos se obtienen resultados pareados o correlacionados.

2. ¿Son conocidos los valores de la varianza, o las varianzas de los supuestos universos?
Como existe la posibilidad de que ambas muestras provengan de un mismo universo, entonces en ese caso se trataría de una sola varianza del universo. En ese caso hay que preguntarse ¿se conoce dicha varianza?
Pero también existe la posibilidad de que las muestras comparadas provengan de universos distintos y en ese caso habría dos varianzas universales. La pregunta en ese caso es ¿son conocidas las varianzas?

3. A la luz de las varianzas de las muestras, ¿podemos suponer que las varianzas son iguales?
Bueno, en esta parte y con todo derecho, podríamos reclamar en contra de las complicaciones de la estadística, pero seguramente el cumplimiento de estas exigencias nos permitirá obtener resultados más confiables.

Cada posible respuesta a estas interrogantes nos conducirá a ocupar una fórmula distinta para calcular el estadístico. Por ello veremos, en primer lugar, la forma de responder a las preguntas planteadas.

Las respuestas

La respuesta a la primera pregunta es fácil, porque se encuentra incorporada dentro del mismo problema de investigación: es una característica de los datos; forma parte del diseño de la investigación.

La segunda pregunta tampoco es tan complicada porque será cuestión de revisar los antecedentes de que dispone el investigador. Lo más frecuente es que este dato se desconozca y, por lo tanto, nosotros asumiremos que la o las varianzas del universo son desconocidas.

Para responder a la tercera pregunta se hace necesario realizar una prueba de hipótesis para probar la igualdad o diferencia de las varianzas. La realización de la misma no es difícil y es frecuente que los programas computacionales de análisis estadístico la hagan en forma automática sin que sea necesario solicitarla, y la entreguen como parte de los resultados. Como lo más frecuente es que las varianzas de las muestras comparadas tengan varianzas similares, nosotros haremos los análisis bajo este supuesto.

Hechas estas aclaraciones procederemos a describir en forma general los estadísticos que participan en cada situación.

a) Comparar los promedios de dos muestras independientes (con varianzas desconocidas y supuestas iguales)
Estadístico a utilizar: 

Donde:
1. “t0” tiene probabilidad de ocurrencia en la tabla de distribución t de Student con   grados de libertad.

2.    es la varianza común estimada.

3.  es el promedio de la muestra 1 y   es el promedio de la muestra 2.

4. n1 y n2 son los tamaños de las respectivas muestras.


b) Comparar los promedios de dos muestras pareadas

Estadístico a utilizar: 

Donde:
1. “t0” tiene probabilidad de ocurrencia en la tabla de distribución t de Student con n-1 grados de libertad.

2.    es la diferencia promedio entre las parejas de datos.

3.   es la desviación estándar de las diferencias entre las parejas de datos.

4. n es el tamaño de la muestra (número de parejas de datos).

c) Comparar los porcentajes de dos muestras

Estadístico a utilizar:

Con 

Donde:
1. z0 tiene probabilidad de ocurrencia en la tabla de distribución normal.

2. p es la estimación del porcentaje común.

3. q es el complemento de p (100-p).

4. n1 y n2 son los tamaños de las respectivas muestras.

Los artículos de la Serie "Estadística Aplicada a la Investigación en Salud" provienen del curso Estadística Aplicada a la Investigación en Salud. Si le interesa ahondar en estos contenidos, le invitamos a tomar el curso en el siguiente link.

 

Licencia Creative Commons Esta obra de Medwave está bajo una licencia Creative Commons Atribución-NoComercial 3.0 Unported. Esta licencia permite el uso, distribución y reproducción del artículo en cualquier medio, siempre y cuando se otorgue el crédito correspondiente al autor del artículo y al medio en que se publica, en este caso, Medwave.
Dirección: Villaseca 21, Of. 702, Ñuñoa, Santiago de Chile.
Fono: 56-2-22743013
ISSN 0717-6384