Editorial

← vista completa

La interpretación de la magnitud de los efectos observados en los ensayos clínicos

Interpretation of the magnitude of the effects observed in clinical trials

Editorial

La falta de diferencia clínicamente significativa ha sido definida como aquel rango de valores que los clínicos, al comparar un nuevo tratamiento con la terapia estándar, consideran demasiado pequeño como para cambiar sus prácticas. Al contrario, una diferencia clínicamente relevante es aquella que lleva a adoptar la nueva práctica1. Cualquiera sea el enfoque, en el contexto clínico la decisión no es simple porque además de la magnitud de la diferencia, entran en juego otros factores tales como el costo, la facilidad de administración, la necesidad de adquirir destrezas para administrar el nuevo tratamiento, los efectos adversos de una y otra intervención, la gravedad del problema clínico tratado, su vulnerabilidad a otras formas de terapia, entre otros. Así, determinar el rango de significación clínica es un juicio subjetivo y es difícil establecer un estándar universal al respecto. Su definición puede variar entre un médico y otro, así como entre la óptica de los profesionales y los pacientes.

Por ejemplo, van Walraven2  evaluó mediante una encuesta la percepción de distintos especialistas (médico de familia, internista, cirujano vascular) sobre la diferencia mínima clínicamente importante, para el uso de propanolol con el objetivo de enlentecer el crecimiento de aneurismas aórticos abdominales, asumiendo que el fármaco fuera eficaz. El autor usó distintas medidas de resultado (velocidad de crecimiento o proporción de pacientes que requiere cirugía) y diferentes métodos de presentación de los datos (reducción absoluta de riesgo, número necesario a tratar). Las percepciones variaron considerablemente según especialidad, experiencia con la patología y con el uso de propanolol, y según el método usado para presentar los resultados. Con ese rango de variación, los tamaños de muestra (TM) que se requerirían para diseñar un estudio de efectividad oscilarían entre 100 y 3.000, es decir, el margen de “error” de estimación (entendido como sobreestimar o subestimar el TM apropiado) es tremendamente amplio.

En el contexto de un ensayo clínico que comparó dos técnicas quirúrgicas en cáncer gástrico, una más extensa que la otra (D1 convencional vs. D2 radical), Fayers3  analizó las percepciones de los investigadores y cirujanos respecto a este punto. El tamaño de muestra del estudio se basó en el supuesto de una diferencia absoluta de un 13,5% en la sobrevida (20% para D1 y 33,5% para D2). En una encuesta a 26 cirujanos, la mayoría consideró que las terapias no serían significativamente distintas si la diferencia se encontrara entre 5% y 10%, algunos entre 10% y 15%, y para unos pocos debía ser de 20% o más. Para aquellos involucrados directamente en el estudio, el rango fue menor (2%-7%). Así, no sólo son esperables distintas opiniones entre los clínicos, sino también entre éstos y los investigadores que en definitiva deben justificar la importancia o necesidad del estudio.

Para algunas mediciones genéricas como calidad de vida, se aprecian también distintos criterios según el tipo de enfermedad que se esté analizando, o de acuerdo a cuál es el dominio específico de la escala que se esté analizando4.

También hay autores que han sugerido involucrar a los pacientes o representantes del público en la definición del efecto clínicamente importante de un nuevo tratamiento5, aunque la experiencia al respecto es poca. Frost publicó una investigación sobre el tema referida a las mediciones de calidad de vida6, y Barrett7 intentó establecer umbrales de significación clínica mínima para 4 intervenciones destinadas a tratar el resfrío común, mediante entrevistas cara a cara o telefónicas a 253 pacientes con síntomas respiratorios agudos, y encontró que éstos esperaban una reducción mínima promedio en la severidad de los síntomas que varió entre 25% y 57% según el tipo de tratamiento, para justificar el costo y potenciales riesgos de los tratamientos. Observó también que la variabilidad en las respuestas entre individuos era muy amplia.

Chan8  propone atributos que considera relevantes para interpretar la importancia clínica de los resultados: identificación clara del desenlace primario, reporte de la diferencia que se espera encontrar entre los grupos, la significación estadística de los resultados, la presentación de los intervalos de confianza, y que exista una interpretación del autor respecto a la relevancia de los hallazgos.

En variables continuas, algunos utilizan como referencia los criterios de Cohen, quien propone interpretar como efecto “mediano” aquel detectable “a ojo desnudo” o perceptible en la práctica diaria sin necesidad de medirlo formalmente, “grande”  aquel de magnitud tal que probablemente no se justifique hacer una investigación para demostrar algo tan evidente, y “pequeño” aquel que, no cumpliendo las condiciones de uno mediano, sí es lo suficientemente importante para justificar el estudio. Los tamaños de efecto (medida utilizada en algunos meta-análisis y ensayos originales) pequeños, medianos y grandes propuestos por Cohen son 0,2, 0,5 y 0,8 respectivamente9.

En resumen, la definición de significación clínica puede variar considerablemente entre individuos, investigadores, la población en general y profesionales asistenciales. Como sea, cuando usted revise un artículo de Medwave y se enfrente a interpretar la magnitud de un resultado, recuerde al menos tres cosas:

  • Que un resultado sea estadísticamente significativo no implica que sea clínicamente importante
  • Quien mejor puede juzgar lo que es importante o no quizás sea el paciente, entonces concéntrese en los resultados que él es capaz de percibir
  • Observe con respeto la opinión del autor del estudio, pero saque sus propias conclusiones