Notas metodológicas

← vista completa

Factores clave en la elección de desenlaces apropiados para estudios clínicos

Key factors in the choice of appropriate outcomes for clinical trials

Resumen

La investigación en salud es la base del conocimiento médico y de las recomendaciones en los sistemas de salud. Por ello, la elección de desenlaces apropiados en estudios de intervenciones terapéuticas es un paso fundamental en la producción de evidencia y, posteriormente, para la toma de decisiones. En este artículo proponemos tres factores clave para la elección de desenlaces: la inclusión de desenlaces reportados por pacientes, ya que ponen el foco del efecto de la intervención en la percepción que tienen los propios pacientes de su estado de salud y calidad de vida; la consideración de desenlaces clínicamente relevantes, los cuales son mediciones directas del estado de salud del paciente y, por ende serán determinantes en la toma de decisiones; y la utilización de herramienta que estandariza y permite la homogeneización en la medición e interpretación de desenlaces, facilitando la producción y posterior síntesis de evidencia apropiada para el ecosistema de evidencia. La correcta elección de los desenlaces permitirá que la evidencia generada de estos estudios ayude a los tomadores de decisiones en salud y los profesionales clínicos a entregar cuidados apropiados centrados en el paciente y a optimizar el uso de recursos en salud e investigación clínica.

Ideas clave

  • Elegir desenlaces apropiados permite generar conocimiento útil para la toma de decisiones en salud.
  • Al elegir desenlaces para una investigación, es clave considerar desenlaces clínicamente relevantes, que sean reportados por los pacientes, y que idealmente hayan sido priorizados previamente por un core outcome set.
  • La significancia clínica debería ser clave al momento de interpretar un desenlace, más allá de la significancia estadística.

Introducción

La investigación en ciencias de la salud es la base del conocimiento médico y, en gran medida, de las recomendaciones generadas en los sistemas de salud [1]. Desde las ciencias básicas hasta la clínica, existe un largo camino para que una intervención candidata (por ejemplo, una molécula o un fenómeno físico) se convierta en un tratamiento clínicamente aceptado y recomendado. La fundación MAGIC (Making Grade the Irresistible Choice) propone un ecosistema de evidencia, conformado por un ciclo desde la producción de evidencia, síntesis, divulgación a clínicos y pacientes, implementación, evaluación y mejora, para nuevamente llegar a la producción de evidencia. Entre cada paso hay un traspaso de información que sirve para sentar las bases de la etapa siguiente. En el centro del modelo, actúan de manera simultánea e integrada cinco elementos: evidencia confiable, entendimiento común de los métodos, datos digitalmente estructurados, herramientas y plataformas, y la cultura de compartir [2].

Este paso del “saber” al “hacer” es el principal objetivo de la investigación clínica, pues sólo habiendo cumplido con esto, se pueden tomar decisiones en salud informadas por evidencia. Dado que la cantidad de investigación ha ido en aumento constante [3,4], es importante que diferentes estudios relativos a un mismo tópico (enfermedad o condición médica) tributen a la generación de conocimiento de una forma consensuada, con el fin de mejorar la calidad de atención y los resultados en salud de los pacientes. Una interacción descoordinada entre investigadores y tomadores de decisiones puede llevar a generar investigación inapropiada con un uso subóptimo de recursos [5]. Es por ello que se requiere de un plan de trabajo internacional coordinado, a través de comunidades científicas conformadas por equipos multidisciplinarios y pacientes o sus representantes, con el fin de priorizar tópicos de investigación, evitar el trabajo redundante y generar recomendaciones clínicas del mayor nivel de evidencia posible [6].

Parte importante de esta acción coordinada consiste en la elección de desenlaces óptimos para ser incluidos en una investigación clínica. La metodología GRADE (Grading of Recommendations Assessment, Development and Evaluation) clasifica los desenlaces como “críticos”, “importantes” y “no importantes” según la importancia relativa que le asigna el panel formulador de recomendaciones. De este modo, un desenlace crítico incide directamente en la toma de decisiones, uno importante probablemente lo hará, y uno no importante no lo hará [7].

Este artículo corresponde al decimotercero de una serie metodológica de revisiones narrativas acerca de tópicos generales en bioestadística y epidemiología clínica, las que exploran y resumen en un lenguaje amigable, artículos publicados disponibles en las principales bases de datos y textos de consulta especializados. La serie está orientada a la formación de estudiantes de pre y posgrado. Es realizada por la Cátedra de Medicina Basada en Evidencia de la Escuela de Medicina de la Universidad de Valparaíso, Chile en colaboración con el Departamento de Investigación del Instituto Universitario del Hospital Italiano de Buenos Aires, Argentina y el Centro Evidencia UC, de la Pontificia Universidad Católica de Chile. El objetivo de este manuscrito es discutir los factores clave que deberían considerar, tanto autores como lectores de evidencia científica, al momento de analizar desenlaces de una investigación clínica.

¿Por qué indicamos un tratamiento?

En general, las intervenciones terapéuticas buscan cinco objetivos: aumentar la longevidad, prevenir comorbilidades, disminuir los síntomas, mejorar la calidad de vida y optimizar el uso de recursos [8]. Por ende, consideraremos una intervención como efectiva cuando mejore un desenlace que refleje uno o más de estos objetivos de la forma más directa posible.

Por ejemplo, la efectividad de dos abordajes terapéuticos para el cáncer de colon en adultos podría determinarse midiendo la mortalidad, recurrencias, aparición de metástasis, tamaño tumoral, marcadores tumorales, sangrado microscópico, calidad de vida, dolor, reacciones adversas, entre otros. Dado que probablemente no todos los desenlaces tengan la misma importancia relativa para pacientes, familiares, profesionales y tomadores de decisiones, la pregunta fundamental es ¿qué desenlace(s) deberíamos elegir o priorizar para ser medidos en investigación clínica? Vale decir, ¿qué desenlace(s) probablemente serán críticos o importantes para la toma de decisiones en salud? [9]. La importancia de este cuestionamiento radica en que la efectividad de las intervenciones estudiadas se determinará según la medición de los desenlaces seleccionados. Un buen desenlace, por tanto, debiese ser aquel que sea factible de ser medido y que sea considerado crítico o importante para la toma de decisiones en distintos contextos. En este artículo, proponemos tres factores clave que todo investigador debería considerar para elegir un desenlace apropiado: la inclusión de desenlaces reportados por pacientes, la consideración de desenlaces clínicamente relevantes y la utilización de Core Outcome Sets.

Primer factor clave: desenlaces reportados por pacientes

La adjudicación de un desenlace en investigación clínica se refiere a la determinación de la presencia, ausencia o cambio en la medición de un desenlace. Los desenlaces en salud pueden ser asignados de distintas maneras y por distintos adjudicadores. Por ejemplo, un cambio en la medición plasmática de biomarcadores a través de exámenes sería adjudicado directamente por el laboratorio, un cambio en el tamaño tumoral sería adjudicado por un profesional clínico mediante la interpretación de exámenes imagenológicos, y un cambio en la intensidad del dolor podría ser adjudicado por los mismos pacientes, o en su defecto, por algún observador externo (cuidadores o personal clínico) [10].

Los desenlaces reportados por pacientes (patient reported outcomes o PRO por su sigla en inglés), son los “reportes del estado de salud de un paciente que vienen directamente de ellos, sin ninguna interpretación de un profesional clínico u otra persona” [11]. Dado que representan la propia percepción de los pacientes de su estado de salud, calidad de vida y de los desenlaces que son más significativos para ellos [12], los desenlaces reportados por pacientes responden directamente a dos de los objetivos por los cuales indicamos un tratamiento: disminuir los síntomas y mejorar la calidad de vida. De este modo, los desenlaces reportados por pacientes, en general proporcionan información crucial para que los profesionales clínicos puedan tomar decisiones apropiadas [10].

En ocasiones hay una pobre correlación entre los desenlaces reportados por pacientes y los desenlaces reportados por laboratorio, profesionales clínicos u observadores externos. Por ejemplo: 

  • En pacientes con enfermedad pulmonar obstructiva crónica, existe una baja correlación entre el volumen espiratorio forzado y la calidad de vida reportada por los pacientes [13].
  • En pacientes oncológicos, la intensidad de los síntomas puede ser subestimada según la interpretación de personal clínico [14].
  • En patologías funcionales como el síndrome de intestino irritable, síndromes dolorosos o síntomas como náuseas y fatiga, la evaluación del estado de un paciente es limitada y difícilmente objetivable a través de la observación externa (reportada por familiares u otro acompañante), la evaluación clínica o exámenes [10]

Como regla general (pero por ningún motivo obligatoria) los desenlaces reportados por pacientes deberían ser priorizados en la planificación de investigación clínica por sobre aquellos reportados por terceros, con la notable excepción de los desenlaces relacionados con sobrevida/mortalidad.

Segundo factor clave: desenlaces clínicamente relevantes

Para la elección de un buen desenlace es crucial saber discernir entre uno clínicamente relevante de uno subrogado. Volviendo al ejemplo de pacientes adultos con cáncer de colon, supongamos que los autores de un ensayo clínico desean saber si el abordaje terapéutico “A” es mejor que “B” midiendo los siguientes desenlaces: mortalidad, calidad de vida y tamaño tumoral.

Mortalidad y calidad de vida probablemente serán desenlaces muy prioritarios para pacientes y clínicos involucrados en la toma de decisiones. Una intervención que logre disminuir la mortalidad con una mejoría de la calidad de vida para pacientes con cáncer de colon, probablemente sea considerado un tratamiento exitoso. Estos desenlaces son relevantes en sí mismos, dado que representan un estado de salud deseable. Por otra parte, la medición del tamaño tumoral no es un desenlace relevante en sí mismo. Su importancia radica en una inferencia o hipótesis causal. Medimos tamaño tumoral porque asumimos, indirectamente, que un menor tamaño tumoral llevará a menor mortalidad y a mejor calidad de vida. Pero este razonamiento causal está sustentado en una lógica fisiopatológica, que muchas veces no se comporta de un modo lineal y directo en la práctica clínica.

Un ejemplo claro de esto ocurre en el tratamiento de la dislipidemia. En pacientes con dislipidemia, podría considerarse que la mejoría del perfil lipídico es un desenlace relevante. Esto se basa en el supuesto teórico de que un paciente con dislipidemia que mejora su perfil lipídico tendrá menor probabilidad de morir o de presentar un evento cardiovascular mayor. Vale decir, estamos asumiendo que hay una relación causal directa y lineal entre mejoría de perfil lipídico con mejoría de sobrevida y disminución de riesgo de eventos cardiovasculares. Sin embargo, esto puede no siempre ser así. A modo de ejemplo, la cerivastatina fue retirada del mercado por aumentar la mortalidad a causa de rabdomiolisis, pese a la notable mejoría que generaba en el perfil lipídico [15].

El ejemplo hipotético del cáncer de colon y el ejemplo real de la cerivastatina en dislipidemia nos llevan a la conclusión de que hay dos tipos de desenlaces:

  1. Desenlaces “clínicamente relevantes”: aquellos que son importantes en sí mismos para tomar decisiones, ya que son mediciones directas del estado de salud de un paciente [16]
  2. Desenlaces “subrogados”, “sustitutos” o “intermedios”: aquellos que no son relevantes en sí mismos, sino que intentan predecir o asociarse a los primeros, representando una medida indirecta de un desenlace clínicamente significativo que se utiliza como predictor en estudios clínicos [17].

Los desenlaces subrogados están relacionados con el mecanismo fisiopatológico, formando parte del proceso biológico que provoca la aparición del desenlace clínicamente relevante, por lo que se espera que puedan predecirse a través de la medición de biomarcadores [16,17]. Sin embargo, como ya hemos visto con la cerivastatina, esto no siempre es así. La Tabla 1 provee ejemplos de estudios en medicamentos como la rosiglitazona [18], el torcetrapib [19] y el flúor [20], que mostraron una disociación entre los hallazgos medidos por desenlaces subrogados y por desenlaces clínicamente relevantes.

Ejemplos de disociación entre desenlaces subrogados y clínicamente relevantes.
Ver tabla

Desde una perspectiva mecanicista podrían considerarse más importantes los desenlaces subrogados, dado que facilitan la realización de ensayos clínicos al tender a ser más accesibles, baratos y rápidos [21]. Sin embargo, para determinar si un tratamiento contribuye al bienestar de los pacientes, debemos conocer cómo este afecta los desenlaces que son importantes para ellos, para posteriormente tomar decisiones centradas en los pacientes [22].

Debemos destacar que un desenlace reportado por pacientes no es necesariamente un desenlace clínicamente relevante. Por ejemplo, un paciente podría reportar prurito leve que no incide en su calidad de vida en un tratamiento con quimioterapia. A su vez, un desenlace clínicamente relevante podría no ser reportado por el paciente, como el caso de mortalidad o ciertos exámenes de laboratorios para patologías específicas (por ejemplo, carga viral en pacientes con virus de la inmunodeficiencia humana, VIH).

¿Son malos los desenlaces subrogados?

Si bien en teoría es preferible utilizar desenlaces clínicamente relevantes ya que entregan mejor información a los profesionales clínicos sobre cuándo utilizar un tratamiento [22], hay ocasiones en que pueden ser difícilmente accesibles al ser más costosos, complejos de medir, requerir un seguimiento prolongado o mayor tamaño muestral [16,23]. En casos en que la medición de un desenlace clínicamente relevante supone una excesiva complejidad metodológica y financiera, se puede justificar la utilización de desenlaces subrogados. Por ejemplo, la medición de hemoglobina glicosilada para pacientes con diabetes mellitus y de carga viral para portadores del VIH son desenlaces subrogados ampliamente utilizados debido a que, por la historia natural de estas patologías, los pacientes permanecen asintomáticos por un extenso período previo a la aparición de desenlaces que podrían ser clínicamente relevantes.

Tercer factor clave: Core Outcome Sets

Debido a la multiplicidad de desenlaces que pueden ser heterogéneamente priorizados entre diferentes grupos de investigadores o tomadores de decisiones, se hace necesario consensuar un conjunto mínimo de desenlaces que sean relevantes de medir en distintos contextos (lo que en terminología GRADE podría asemejarse al concepto de desenlaces críticos e importantes). Los Core Outcome Sets (COS) han intentado generar estos consensos [24].

Los Core Outcome Sets son conjuntos de desenlaces consensuados y estandarizados, que deberían ser medidos y reportados en todos los ensayos clínicos de una determinada enfermedad o condición de salud [25]. Estos han sido recopilados en recursos especializados, tales como el sitio web de la Iniciativa Core Outcome Measures in Effectiveness Trials (COMET) [24]. Para el desarrollo de los Core Outcome Sets, se ha elaborado una guía de recomendaciones, el COS standards for development (COS-STAD), en la cual se han definido tres pasos. El primer paso consiste en definir el alcance del trabajo, identificando la patología, población, escenario e intervención que se investigará, y cerciorarse de que no existe otro trabajo del mismo tema en la base datos del COMET. El segundo paso es la conformación de un panel multidisciplinario compuesto por investigadores, profesionales de la salud, profesionales de la industria médica, pacientes, familiares y/o cuidadores. El tercer paso comprende la identificación y priorización de los outcomes. La identificación se realiza mediante estudios cualitativos primarios o secundarios que evalúen los outcomes reportados en los ensayos clínicos. La priorización, es habitualmente realizada a través de la técnica Delphi, la cual consiste en que el equipo investigador envía un listado de los outcomes relevantes identificados al panel multidisciplinario, para que estos otorguen un puntaje de acuerdo a la importancia que tienen para ellos. Luego se realiza una segunda ronda, en donde se eliminan los outcomes que unánimemente han sido considerados no relevantes y se envía un nuevo listado al panel multidisciplinario con una retroalimentación y el puntaje obtenido en cada outcome, de manera que puedan cambiar su puntaje si lo consideran pertinente. Este proceso se repite hasta lograr un consenso, para finalmente realizar una discusión final de los resultados obtenidos [26,27].

Por ejemplo, el sitio web de la iniciativa COMET incluye un estudio que investigó los Core Outcome Sets para el eczema [28], en donde los desenlaces consensuados propuestos para ser priorizados en una investigación en este tópico, fueron:

  1. Signos clínicos.

  2. Síntomas.

  3. Control a largo plazo de las erupciones.

  4. Calidad de vida.

De esta manera, los Core Outcome Sets estandarizan y permiten la homogeneización en la medición de desenlaces, facilitando la producción y posterior síntesis de evidencia apropiada para el ecosistema de evidencia [29].

Interpretación de desenlaces: significancia estadística versus significancia clínica

Una vez elegidos o priorizados los desenlaces, la interpretación adecuada de los resultados de una investigación en salud es fundamental para una óptima toma de decisiones clínicas y de salud pública. Por lo tanto, es importante comprender las diferencias entre la significancia estadística y clínica, ya que un desenlace estadísticamente significativo no implica necesariamente que sea clínicamente significativo, y viceversa [30,31].

La significancia estadística se refiere a que la probabilidad de que un desenlace haya ocurrido por el azar es muy baja. Usualmente se determina por convención, como un valor p menor a 0,05 en un test estadístico determinado, o como un intervalo de confianza al 95% que no cruza la línea de no significancia estadística [32,33]. En cambio, la significancia clínica está delimitada por la diferencia clínica mínimamente importante (minimally important difference o MID en inglés), la cual marca el cambio más pequeño en los desenlaces reportados por pacientes que ellos perciben como importante (ya sea beneficioso o perjudicial), y que podría hacer que tanto él como su tratante consideren un cambio en la terapia [34]. La significancia clínica está determinada por la precisión de los resultados [35,36]. Supongamos que para el tratamiento de hipertensión arterial fijamos una diferencia clínica mínimamente importante de 10 milímetros de mercurio. Si el intervalo de confianza (una medida de precisión de los resultados) de un estudio indica que un tratamiento genera un cambio de presión arterial de -20 milímetros de mercurio, con un intervalo de confianza que va de -25 a -15 milímetros de mercurio, podemos decir que se estima que el tratamiento disminuirá la presión arterial en una magnitud tan alta como 25 milímetros de mercurio o tan baja como 15 milímetros de mercurio. En ambos casos (incluso en el peor de los casos) el tratamiento genera un cambio clínicamente significativo de presión arterial (mayor a la diferencia clínica mínimamente importante predefinida). Este resultado es preciso, dado que no cruza la línea de significancia clínica. Por otra parte, si el cambio fuera de -10 milímetros de mercurio con un intervalo de confianza que va de -15 a -5 milímetros de mercurio, tendríamos un escenario más complejo. En el mejor de los casos (-15 milímetros de mercurio) la diferencia sería clínicamente significativa, pero en el peor de los casos (-5 milímetros de mercurio) sería clínicamente irrelevante. En este caso, el intervalo de confianza cruza el umbral de significancia clínica y es, por tanto, impreciso. En este manuscrito no ahondaremos en este tema específico, puesto que ha sido revisado en extenso en otro artículo de esta serie metodológica [36]. Una correcta interpretación de un desenlace incluye la determinación no solo de su significancia estadística, sino también de su significancia clínica, utilizando una diferencia clínica mínimamente importante explícita.

Aplicación a un proyecto de investigación

Para entender mejor los factores clave propuestos para la elección de un desenlace apropiado, analizaremos la aplicación de cada uno al caso hipotético de un grupo de investigadores que debe seleccionar los desenlaces a incluir en un estudio que compara dos tratamientos para el asma bronquial.

Primer factor clave: desenlaces reportados por pacientes

En primer lugar, para tener una visión general podemos clasificar todos los posibles desenlaces a medir de acuerdo a quien lo reporta, los cuales se detallan en la Tabla 2.

Posibles desenlaces en un estudio de asma bronquial.
Ver tabla

También, algunos desenlaces pueden ser reportados por más de un adjudicador. Por ejemplo, el número de hospitalizaciones, consultas a urgencias y exacerbaciones o crisis asmáticas, pueden ser reportadas tanto por el propio paciente, por un familiar o por el profesional clínico.

Como regla general, es recomendable incluir aquellos desenlaces reportados por pacientes (como los mencionados en la Tabla 2) ya que inciden directamente en la percepción de su estado de salud y, por ende, orientarán a tomar decisiones según sus resultados.

Segundo factor clave: desenlaces clínicamente relevantes

En segundo lugar, se deberían priorizar los desenlaces clínicamente relevantes por sobre los subrogados, a menos que sea muy complejo contar con los primeros. Dentro de los desenlaces clínicamente relevantes podemos encontrar la calidad de vida, intensidad y frecuencia de síntomas o tolerancia al ejercicio, ya que son mediciones directas del estado de salud de los pacientes y permitirán tomar decisiones en sus tratamientos.

Para evaluar este factor, buscamos en el sitio web COMET-initiative.org y seleccionamos un estudio que desarrolló un Core Outcome Sets para evaluación de asma bronquial [37]. Los desenlaces consensuados incluyeron:

  1. Exacerbación asmática.

  2. Cambios en el control del asma (percepción subjetiva, presencia de sintomatología y valor del volumen espiratorio forzado pre-broncodilatador).

  3. Calidad de vida medida por encuestas estandarizadas de asma.

  4. Número de hospitalizaciones relacionadas con el asma.

  5. Consultas en unidad de urgencias debido al asma.

Para concluir, un set de desenlaces apropiados para esta pregunta sería: calidad de vida, intensidad y frecuencia de síntomas, tolerancia al ejercicio, número de hospitalizaciones o consultas al servicio de urgencias, número de crisis o exacerbaciones asmáticas, ya que son reportados por el paciente o afectan directamente en cómo se siente, son clínicamente relevantes y están priorizados en un Core Outcome Sets.

Recomendaciones finales

Un desenlace que cumple con los tres aspectos propuestos durante este artículo, y que es interpretado considerando diferencias clínicamente significativas, será un desenlace probablemente relevante para la toma de decisiones en diversos contextos. Asimismo, permitirá una mejor producción y utilización de la evidencia, lo que debe ser considerado por los investigadores a modo de optimizar recursos. La consideración de estos factores clave para priorizar e interpretar desenlaces contribuye a las primeras etapas del ecosistema de evidencia (producción y síntesis de evidencia). En consecuencia, también aporta a un mejor desarrollo de las siguientes etapas del ecosistema (divulgación, implementación, evaluación y mejora), de manera que los tomadores de decisiones en salud y los profesionales clínicos puedan entregar cuidados apropiados en salud a la vez que optimizan el uso de recursos en salud e investigación clínica [38].

Proponemos las siguientes recomendaciones para una apropiada elección de desenlaces a evaluar al momento de diseñar protocolos de investigación clínica:

  1. Priorizar desenlaces reportados directamente por los pacientes (con la excepción de desenlaces relacionados con mortalidad/sobrevida), como manera de evaluar desenlaces que inciden directamente en la percepción, calidad de vida y/o bienestar que tienen los pacientes sobre su condición de salud.

  2. Siempre que sea posible, preferir desenlaces clínicamente relevantes, ya sean reportados por pacientes o no, puesto que estos favorecen una adecuada toma de decisiones clínicas.

  3. Una vez identificados los potenciales desenlaces a incluir en un estudio, revisar el Core Outcome Sets de la condición de salud en el sitio COMET u otro afín, con el objetivo de estar seguros de que se incluirán los desenlaces mínimos que por un consenso multidisciplinario han sido definidos como imprescindibles para evaluar una condición de salud.

  4. Se sugiere considerar la inclusión de pacientes en el diseño del protocolo y discusión de los resultados obtenidos en estudios clínicos, de manera de generar un acercamiento a la investigación de su propia patología desde la confección de estudios primarios experimentales. Creemos que podría ser beneficioso involucrarlos desde etapas tempranas en la generación de conocimiento clínico.