Notas metodológicas

← vista completa

Conceptos generales en bioestadística y epidemiología clínica: estudios observacionales con diseños transversal y ecológico

General concepts in biostatistics and clinical epidemiology: Observational studies with cross-sectional and ecological designs

Resumen

Los estudios observacionales analizan las variables de interés en la muestra o en la población, sin intervenir en ellas. Pueden ser meramente descriptivos si se focalizan en la descripción de las variables, o analíticos, en el caso de presentar grupos de comparación para establecer asociaciones mediante la inferencia estadística. Los estudios transversales y los estudios ecológicos, también llamados correlacionales, son dos diseños metodológicos observacionales. Los estudios transversales recogen los datos de la variable exposición y desenlace en un mismo momento, para describir sus características y eventualmente estudiar asociaciones. Los estudios ecológicos describen y analizan las correlaciones entre distintas variables, pero su unidad de análisis corresponde a datos agregados de múltiples individuos. En ambos casos no puede inferirse una relación causal, pero sí pueden establecerse asociaciones de gran interés para la investigación biomédica. Esta revisión es la segunda entrega de una serie metodológica sobre conceptos generales en bioestadística y epidemiología clínica desarrollada por la Cátedra de Metodología de la Investigación Científica de la Escuela de Medicina de la Universidad de Valparaíso, Chile. En este artículo se abordan conceptos teóricos generales sobre estudios transversales y estudios ecológicos, considerando sus aplicaciones, medidas de asociación, ventajas, desventajas y reporte. Finalmente, se discuten algunos conceptos de relevancia sobre diseños observacionales para los estudiantes de pre y posgrado de ciencias de la salud.

Ideas clave

  • Los diseños transversales recogen las variables de estudio simultáneamente y su unidad de análisis son personas individuales. Son útiles en la determinación de la prevalencia y permiten establecer asociaciones entre variables rápidamente.
  • Los estudios ecológicos analizan las correlaciones entre variables cuya unidad de análisis son datos agrupados. Suelen ser fáciles de conducir y permiten el estudio de grandes poblaciones.
  • Estos estudios observacionales no pueden establecer inferencias causales, pero sí relaciones estadísticas de gran importancia para la investigación biomédica y la salud pública.

Introducción

Una clasificación esencial en la epidemiología clínica se hace en virtud del criterio de la observación versus la experimentación, es decir, si los investigadores se centran en la observación de las variables medidas o si aplican una intervención entre los participantes del estudio. En el primer caso, nos referimos a los estudios observacionales, en donde se recogen datos de interés y luego se analizan descriptiva y/o analíticamente, lo que contempla la aplicación de entrevistas, instrumentos de medición, exámenes de laboratorio, entre otros, pero sin intervenir la variable de exposición. En el segundo caso, los investigadores manejan la variable de exposición, lo que se traduce en someter a los participantes a una intervención controlada para estudiar la modificación de algunos estimadores de interés (el desenlace o variable de respuesta), vale decir, se trata del experimento clínico, que en epidemiología clínica se ha denominado ensayo clínico. Hoy en día, los estudios observacionales juegan un rol esencial en diversos aspectos de la investigación en ciencias de la salud e incluso otorgan respuestas cuando los ensayos clínicos son éticamente cuestionables o difícilmente realizables.

Este artículo corresponde a la segunda entrega de una serie metodológica de seis revisiones narrativas acerca de tópicos generales en bioestadística y epidemiología clínica, las que explorarán artículos publicados disponibles en las principales bases de datos y textos de consulta especializados. La serie está orientada a la formación de estudiantes de pre y posgrado, y es realizada por la Cátedra de Metodología de la Investigación Científica de la Escuela de Medicina de la Universidad de Valparaíso, Chile. El objetivo de este manuscrito es abordar los principales conceptos teóricos y prácticos de dos diseños observacionales: los estudios transversales y los estudios ecológicos.

Estudios descriptivos versus estudios analíticos

Otra clasificación en la taxonomía de los diseños metodológicos es la que define a los estudios según sean descriptivos y/o analíticos. Los estudios presentan una finalidad descriptiva si su objetivo es meramente describir la frecuencia de distribución de las variables sin la pretensión de obtener conclusiones a partir del estudio de una asociación[1], o analíticos, si es que incorporan algún nivel de análisis estadístico inferencial a razón de establecer asociaciones en los datos. Los estudios descriptivos constituyen una gran parte de las investigaciones publicadas, y han contribuido a la comprensión de la semiología y la historia natural de las enfermedades, la frecuencia de determinados fenómenos en la población, el estudio de las condiciones infrecuentes y el establecimiento de intervenciones, dando lugar al origen de nuevas hipótesis. Entre los estudios descriptivos encontramos los reportes y las series de caso, en donde se presentan condiciones infrecuentes a nivel de diagnóstico, tratamiento y/o pronóstico[2]. Estos suelen constituir la primera fuente de evidencia respecto a condiciones emergentes, tales como la observación clínica de ceguera en recién nacidos que llevó a su asociación con las altas concentraciones de oxígeno en incubadoras o de adenoma hepatocelular en mujeres jóvenes, concluyendo su relación con la exposición a altas dosis de drogas anticonceptivas[1]. En el caso de los reportes o series de casos, se presenta un análisis descriptivo de los datos reportados[3]. Diversos autores sitúan también a los estudios transversales (estudios sobre individuos) y a los estudios ecológicos (estudios sobre poblaciones) dentro de la categoría de estudios descriptivos. Sin embargo, ambos diseños pueden tener una orientación analítica, en donde se aplican pruebas de hipótesis en torno a al menos dos grupos de participantes (grupos de comparación) para obtener una inferencia estadística, por lo tanto, pueden ser clasificados asimismo en el capítulo de estudios analíticos[3],[4],[5].

Estudios transversales

El hecho central en los estudios transversales es que tanto la variable que se considera como de exposición (variable X, independiente, explicativa, predictora o factor) como la variable de desenlace (variable Y, dependiente, explicada, predicha o respuesta) son medidas simultáneamente, es decir, la temporalidad es transversal, o “en un solo momento”. Este tipo de temporalidad no permite asegurar que la exposición haya precedido al desenlace por no existir un seguimiento en el tiempo. En los estudios transversales se puede estudiar una muestra que se considere como “representativa” de la población de proveniencia o bien se puede analizar la población completa, como en el caso de los censos poblacionales. En ambas situaciones, se busca conocer la frecuencia o la prevalencia (por lo que también se le conocen como “estudios de prevalencia”) de una condición de interés, ya sea una patología, una característica, un factor conceptualizado en la literatura como pronóstico (factor protector o factor de riesgo), entre otros. No obstante, también se puede estudiar la asociación entre dos variables de interés, de modo que el estudio tenga una orientación analítica[3],[4],[5]. En el siguiente recuadro se ejemplifica un estudio transversal[6].

Un estudio buscó determinar la prevalencia de asma en niños y analizar su asociación con ser fumador pasivo, estar expuesto al tráfico vehicular (factores de riesgo) y la ingesta de fruta deshidratada (posible factor protector). Los investigadores encontraron que la prevalencia de asma aumentaba con el número de fumadores con quienes vivían, pero no se asociaba a vivir próximos a una avenida principal ni al consumo de frutas deshidratadas. Así, en este estudio transversal, coexistieron el componente descriptivo (estimación de la prevalencia) y el analítico (estudio de las asociaciones entre las variables). 

Medidas de asociación
Aunque en el ejemplo anterior fue posible establecer las asociaciones mencionadas utilizando métodos estadísticos avanzados, no se podría determinar directamente el riesgo, ya que esto queda reservado para estudios que tengan un enfoque temporal longitudinal[7], es decir, es una cuestión del diseño metodológico y no del análisis estadístico. Por lo tanto, las medidas de asociación apropiadas en el caso de los estudios transversales son la Odds ratio (OR) y la razón de prevalencias (PR, por la sigla en inglés para “prevalence ratio”). La Odds ratio puede definirse como el exceso o defecto de ventaja que tienen los individuos expuestos de presentar la condición frente a no padecerla, respecto de la ventaja (o defecto) de los individuos no expuestos de presentar la condición frente a no presentarla. Por su parte, la interpretación de la razón de prevalencias es más simple, directa y hasta cierto punto intuitiva, ya que señala cuántas veces es más probable que los individuos expuestos a un fenómeno presenten la condición respecto a aquellos no expuestos[8],[9],[10]. Pese a que corresponden a conceptos distintos, el interpretar la Odds ratio como una razón de prevalencias es un error conceptual frecuentemente observado en investigaciones publicadas.

Un tipo particular de estudios transversales son los estudios de pruebas diagnósticas, en donde se evalúa la capacidad de discriminación de un test (prueba índice) para determinar el diagnóstico de una enfermedad[11]. Por lo general, se realiza mediante la comparación de los resultados de la prueba con el estándar de referencia (también conocido como patrón de oro o criterio de verdad) en sanos y enfermos, para hacerlo posteriormente en personas con sospecha de la enfermedad[12]. Estos estudios evalúan características operacionales de la prueba índice, tales como su especificidad, sensibilidad, valores predictivos y razones de verosimilitud[13]. En el ejemplo 2 se muestra un estudio de pruebas diagnósticas, cuyo diseño corresponde a un estudio transversal[14].

Un estudio transversal analizó la utilidad diagnóstica de una prueba antigénica rápida (prueba índice) para el diagnóstico de amigdalitis aguda en niños de entre 2 y 14 años. Esta prueba fue comparada con el cultivo faríngeo, considerado como el estándar diagnóstico de referencia. Se halló una sensibilidad de 86,5% y una especificidad de 91,5%, demostrando que la prueba es útil para el diagnóstico de la patología en este contexto.

Ventajas y desventajas
Los estudios transversales son usualmente rápidos de ejecutar. Debido a que no involucran un seguimiento temporal, las pérdidas de seguimiento no son un problema y los costos económicos asociados son menores, lo que permite establecer asociaciones rápidamente[1]. La principal desventaja tiene que ver con la temporalidad de los sucesos, pues al no ser claro que la variable de exposición (causa) preceda a la variable de resultado (efecto), no es posible establecer una relación de causalidad[1],[15], por lo que se deben interpretar los resultados en contexto y con prudencia. Asimismo, este diseño es poco útil en patologías infrecuentes o cuya prevalencia cambia rápidamente, como en el caso de las enfermedades infecciosas[5].

Estudios ecológicos o correlacionales

Los estudios ecológicos o correlacionales comparten la característica central de los estudios transversales, ya que—desde el punto de vista de la temporalidad—tanto las variables explicativas como las explicadas son recogidas simultáneamente. El que sean conocidos como “estudios ecológicos” se asocia a que diversas investigaciones de este tipo utilizan zonas geográficas para definir las unidades de análisis. En efecto, su particularidad radica en la unidad de análisis, ya que se analizan datos agrupados (unidades ecológicas) que corresponden a estimadores que provienen de la integración de datos individuales, es decir, son estudios dirigidos a las poblaciones, como se señaló anteriormente[16]. Se estudia la frecuencia de una condición en una población y su correlación (de aquí su nombre, estudios “correlacionales”) con una o más variables de exposición que también se miden de modo agregado[5]. Por ejemplo, un estudio ecológico[17] analizó la inequidad en la distribución de otorrinolaringólogos en países latinoamericanos, concluyendo que en todos los países los especialistas fueron más frecuentes en zonas socio-geográficamente aventajadas y en las capitales, lo que denota una alta inequidad en la distribución, por lo que los autores enfatizan la importancia de implementar políticas que mejoren el acceso a esta disciplina médica.

Algunas de sus utilidades consideran el mapeo de enfermedades y de sus factores de riesgo, la realización de comparaciones a gran escala y el estudio de estrategias de salud pública[16],[18]. Asimismo, los estudios ecológicos han aportado significativamente en el análisis de exposiciones ocupacionales a agentes nocivos, como en el caso de la asociación entre la exposición a asbesto y la presencia de mesotelioma[18],[19].

Aunque el principal tipo de estudio ecológico es el geográfico, en donde se compara una condición de interés entre regiones geográficas, también es posible monitorear una población a lo largo del tiempo para evaluar sus cambios, en el caso de los estudios ecológicos longitudinales. Estos son particularmente sensibles a sesgos, como el asociado con el método de determinación de la enfermedad, pues los exámenes y los criterios diagnósticos tienden a mejorar con el tiempo. Otro tipo de estudio ecológico son los estudios de poblaciones migrantes, los cuales se usan para discriminar factores genéticos de factores ambientales en función de la variación geográfica y cultural. No obstante, se debe tener en cuenta que la población migrante puede no ser representativa de la población de procedencia y que la salud puede verse afectada por el propio proceso de migración. En el ejemplo 3 se muestra un estudio ecológico en poblaciones migrantes[20],[21].

Ejemplo 3. En el estudio de Ødegaard publicado en 1932, titulado “Emigration and insanity”, se observó que la tasa de hospitalización (unidad ecológica) por esquizofrenia era mayor en noruegos que habían emigrado a Estados Unidos comparado con sus compatriotas residentes en Noruega, lo que abrió el debate en torno al rol que juegan los factores ambientales en la psicopatología de la psicosis. No obstante, los resultados deben evaluarse con prudencia por los motivos ya señalados.

Medidas de asociación
En este caso, la medida de asociación será un coeficiente de correlación (de aquí el nombre de “estudios correlacionales”) que indica el grado de asociación lineal entre dos variables que se conceptualizan como de exposición y de resultado[1]. Con ello, mediante métodos de regresión estadística multivariada podría plantearse el estudio de variables asociadas a la variable dependiente, el análisis de las variables de confusión y la construcción de modelos predictivos para la variable respuesta[22].

Ventajas y desventajas
Por lo general, los estudios ecológicos son fáciles de conducir, pues los datos suelen encontrarse ya recogidos en estadísticas de instituciones públicas o registros de carácter abierto, tales como las encuestas nacionales[23]. Esto solucionaría también la complejidad bioética ligada al estudio directo en seres humanos y su costo económico[1]. Además, permiten el estudio de grandes poblaciones.

La principal desventaja asociada a la inferencia ecológica tiene que ver con la reducción de información que puede producirse en el proceso de agregación de los datos, la que no permite identificar asociaciones a nivel individual[16]. Debido a que los datos se analizan de forma agregada, la relación entre eventual exposición y probable desenlace no puede ser empíricamente determinada a nivel individual, por lo que inferir sobre la naturaleza individual a partir de estadísticas agregadas del grupo al que dichos individuos pertenecen (por ejemplo, tasa de hospitalización en un país) es un error conocido como falacia ecológica, sesgo ecológico o falacia de ambigüedad por división[1],[18]. Por ejemplo, un estudio[24] demostró una correlación lineal muy significativa entre el consumo de chocolate per cápita y el número de premios Nobel por cada 10 millones de personas en 23 países estudiados (r = 0,791, p < 0,0001); no obstante, esto no asegura que las personas galardonadas consumieron grandes cantidades de chocolate. Otra desventaja, propia de los estudios en donde se miden las variables de interés en un mismo momento, es la ambigüedad temporal, ya que no será posible definir qué fenómeno precede temporalmente a otro. Finalmente, el análisis estadístico de este tipo de diseños podría dificultarse por la multicolinealidad, fenómeno en donde existe una correlación entre las variables predictoras (independientes) de un modelo multivariado, lo que podría disminuir la relevancia de variables de mayor interés[25].

Directrices de reporte

En 2007, una colaboración internacional de epidemiólogos, metodólogos, estadísticos, investigadores y editores de revistas publicó la directriz de reporte Strengthening the Reporting of Observational studies in Epidemiology o STROBE, por su sigla en inglés (http://www.strobe-statement.org/)[26], basándose en la experiencia de la pauta CONSORT, símil para ensayos clínicos[27]. Su propósito es promover la presentación clara y transparente de la investigación, por lo que no se trata de una herramienta de evaluación de la calidad. STROBE se focaliza en los tres diseños metodológicos observacionales más difundidos: estudios transversales, estudios de casos y controles y estudios de cohorte. Incluye 22 ítems agrupados en seis dominios: título y resumen, introducción, métodos, resultados, discusión e información adicional[27],[28]. Pese a que el uso de pautas de reporte ha sido enfatizado internacionalmente, la aplicación de STROBE no es homogénea en la literatura publicada[29],[30], en tanto que no existe una iniciativa como la mencionada para estudios ecológicos.

Prevención y control de la confusión

Un desafío fundamental para los estudios observacionales es la prevención y el control del efecto de los sesgos que amenazan su validez interna, sobre todo el sesgo de confusión. La confusión puede ocurrir, por ejemplo, cuando los grupos comparados difieren en sus características de base (por ejemplo, las biodemográficas), de modo que existen diferencias intergrupales adicionales a la variable que se quiere comparar[31]. Otra fuente de confusión se asocia a que muchos estudios observacionales emplean datos que originalmente fueron recolectados con propósitos distintos a los objetivos de la investigación, por ejemplo, encuestas nacionales, estadísticas hospitalarias, entre otros. En respuesta a ello, a nivel de diseño de un estudio transversal, se puede recurrir a estrategias como la rigurosidad en los criterios de elegibilidad de la muestra y la restricción (por ejemplo, la selección estricta de sujetos que presenten la característica que se quiere “neutralizar” o bien que no la presenten)[32]. A nivel de análisis estadístico, se puede emplear el análisis estratificado, que es el análisis según estratos de individuos agrupados en virtud de una variable de confusión, como edad, sexo; y, como ya ha sido referido, se pueden utilizar los modelos de regresión estadística multivariada, cuya finalidad es la identificación de las variables que al ajustar el modelo actúen como variables de confusión[33]. Las formas de controlar la confusión a nivel del análisis de datos serán profundizadas mayormente en el próximo artículo de esta serie.

Consideraciones finales

Aunque suelen ser conocidos como estudios de prevalencia que solo apuntan al componente descriptivo, los estudios transversales muchas veces dan pie al estudio de asociaciones, en caso de que presenten un grupo de comparación. No obstante, si el objetivo es determinar la prevalencia de alguna condición, el diseño apropiado es un estudio transversal, pero el muestreo a realizar debe ser aleatorio, ya que en el caso de aplicar muestreos no probabilísticos solo se podría estudiar su frecuencia. De este modo, en el estudio citado en el ejemplo 1, para determinar la prevalencia de asma en niños se realizó un muestreo aleatorio en distintos colegios del Reino Unido[6]. El estudio de la prevalencia no debe confundirse con el de incidencia. La determinación de la incidencia (frecuencia de eventos en un período de tiempo determinado) se realiza en estudios de cohorte (diseños observacionales cuyo eje temporal es longitudinal, ya sea prospectivo o retrospectivo).

Algunos autores han puntualizado que debido a fenómenos que tienen gran influjo en los resultados, tales como la falacia ecológica, la ejecución de estudios ecológicos solo debería considerarse cuando no sea posible realizar un análisis de los datos individuales[31]. No obstante, y por las ventajas y oportunidades ya mencionadas, muchas veces son la primera opción, sobre todo en objetivos que implican el interés de políticas de salud pública, como el análisis de la distribución geográfica de especialistas en otorrinolaringología[17] o de los factores ambientales en la psicosis[20].

Los estudios observacionales suelen ser la primera aproximación a nuevas hipótesis y sus usos son múltiples. En el caso de presentar un análisis estadístico inferencial, pueden plantear una hipótesis estadística que se estudia mediante pruebas de hipótesis, dando lugar a asociaciones. Los estudios transversales y ecológicos, debido a su temporalidad, no permiten establecer hipótesis causales. Su conducción debe ser rigurosa, considerando que son vulnerables a múltiples sesgos, sobre todo al sesgo de confusión, el que puede prevenirse a nivel del diseño y controlarse durante el análisis estadístico. En su conjunto, los estudios observacionales nos ofrecen posibles maneras nuevas de mirar las cosas (Figura 1).

Esquema de síntesis sobre los estudios transversales y los estudios ecológicos. Fuente: diseñada por los propios autores.
Fuente: diseñada por los propios autores
Tamaño completo