Conferencia

← vista completa

Sobre los consensos en medicina

On consensus in medicine

Resumen

Este texto completo es una transcripción editada y revisada de una conferencia que se dictó en el III Consenso Nacional de Diagnóstico y Tratamiento del Cáncer de Mama, realizado en Coquimbo entre los días 26 y 28 de agosto de 2009. El consenso fue organizado por la Sociedad Chilena de Mastología bajo la presidencia de la Dra. Soledad Torres.

Introducción

En esta presentación se hablará sobre el concepto de los consensos en general y en Medicina, en particular.

Significado de “consenso”

La palabra consenso viene del latín consentire, que significa acuerdo y tiene un amplio espectro de significados en las diferentes actividades humanas: en política, es la base de la democracia; en lo social, de la convivencia; en lo sexual, de la reproducción. En lo que se refiere a la ciencia el consenso no tiene ningún significado, porque la ciencia no se basa en consensos; si así fuera muchas teorías (como las de la relatividad o la cuántica) deberían ser consideradas como falsas, porque la mayor parte de los científicos no las comprenden, sin embargo estas teorías han condicionado la mayoría de los progresos científicos y tecnológicos del siglo XX. Por lo tanto en ciencia no existe consenso, ya que es lo opuesto a lo científico. Para determinar si el consenso es aplicable en Medicina se debe definir si esta actividad está más vinculada a la ciencia, a la política, a lo social o a lo sexual.

¿Consenso en medicina? ¿Por qué no?

La Medicina es una actividad humana heterogénea que desde hace más de un siglo se basa parcialmente en la ciencia, existiendo varios factores no científicos que influyen en la forma de desarrollar esta actividad, como la experiencia personal, la superstición o ignorancia parcial, los diferentes tipos de empatía con colegas, pacientes o industrias y factores económicos como número de consultas y de exámenes, viajes científicos y actividades sociales.

La Medicina basada en la Ciencia ha recorrido un largo camino desde la Antigüedad y la Edad Media, cuando se basaba en simples observaciones, hasta la época actual, en que se desarrolla la formulación de hipótesis y su evaluación rigurosa a distintos niveles de conocimiento, tratando de profundizar cada vez más en ellos. Así, por ejemplo:

  • En 1859, Charles Darwin publicó El Origen de las Especies, obra que significó un gran avance para la Medicina basada en la ciencia.
  • En esa misma época R. Virchow publicó el artículo Die Cellular-pathologie (1858), en el que estableció que cada célula deriva de una célula preexistente y que los tumores derivan de células preexistentes en el cuerpo.
  • En 1866, G. Mendel enunció las leyes de la herencia a través de los genes.
  • En 1879, W. Fleming describió los cromosomas.
  • En 1953, Watson y Crick demostraron la estructura en doble hélice de la molécula de ADN, dando origen a la biología molecular moderna.
  • La imagen de la Fig. 1 muestra la complejidad de los conocimientos sobre la regulación del ciclo celular alcanzados hasta el año 2003.
Regulación del ciclo celular (A. Brahme, Karolinska Institutet, 2003).
Tamaño completo

La Medicina basada en la Ciencia exige que los conocimientos que se adquieren en el área biológica sean aplicables a la práctica clínica; para ello es imprescindible que estos conocimientos se evalúen en estudios clínicos que cumplan con el rigor de los análisis estadísticos aceptados. El primer estudio aleatorio se llevó a cabo en el Reino Unido durante la Segunda Guerra Mundial y se enfocó en el uso de estreptomicina en pacientes con tuberculosis. Desde esa época se reconoce el peligro de sacar conclusiones a partir de series históricas o estudios retrospectivos. Actualmente se sabe que las hipótesis se deben plantear claramente y someterla a un estricto proceso de evaluación; no obstante, como éste suele ser largo y tedioso no siempre es debidamente apreciado por todos los médicos.

Los estudios no aleatorios pueden ser útiles para determinar factores pronósticos, siempre que se utilicen grandes muestras, análisis multifactoriales correctos, lo cual no sucede en muchas publicaciones, y se excluyan del análisis los factores relacionados con el tratamiento. Asimismo, este tipo de estudio no sirve para establecer los factores predictivos del efecto de un tratamiento, que sólo se pueden analizar en el material clínico proveniente de un estudio aleatorio (evaluando el tratamiento en cuestión), o después de un tratamiento preoperatorio si la respuesta tumoral es el principal criterio de evaluación

Además, los estudios no aleatorios pueden entregar resultados erróneos en la cuantificación del efecto de un tratamiento. Por ejemplo, al evaluar el tratamiento con anticoagulantes en enfermedades cardiovasculares se encontró una reducción de la mortalidad de 62% en controles históricos, de 34% en controles concurrentes no históricos y solamente de 22% en estudios aleatorios; esto muestra que los estudios no aleatorios pueden sobreestimar de manera importante el efecto de un tratamiento.

El estudio de subgrupos es otra forma de analizar datos. Un ejemplo es un estudio aleatorio que se publicó en 1980 (1) en el que se comparó el grado de prevención de enfermedades coronarias al tratamiento con clofibrato. La mortalidad a cinco años fue 20% entre los 1100 pacientes tratados con clofibrato y 21% entre los 2800 pacientes que recibieron placebo, diferencia que no fue significativa. Luego los investigadores definieron dos subgrupos: los buenos adherentes como aquellos que recibieron 80% o más de la dosis de clofibrato y los malos adherentes como a los que tomaron dosis menores. El análisis mostró que la mortalidad de los buenos adherentes fue inferior a la de los malos adherentes, con 15% y 25% respectivamente, diferencia claramente significativa. Esto parece sugerir que el medicamento es eficaz, puesto que los resultados son mucho mejores en los pacientes que cumplieron el tratamiento indicado; sin embargo, al analizar los resultados de los pacientes que recibieron el placebo se encontraron cifras similares: los buenos adherentes tuvieron una mortalidad de 15% y los malos adherentes, de 28%. Lo anterior es un ejemplo típico de exploración “de pesca”, ya que no era la hipótesis inicial del estudio (1).

Este tipo de estudio de subgrupos es de aplicación frecuente en oncología; de hecho, la mayoría de los estudios en esta área involucran comparaciones entre “respondedores y “no respondedores” a un determinado tratamiento; si los resultados muestran diferencias significativas éstas se atribuyen a un efecto positivo del tratamiento. Esta respuesta tumoral es un atributo adquirido post-hoc, en un proceso típicamente relacionado con las “expediciones de pesca”.

Un ejemplo clásico de análisis de subgrupos en estudios aleatorios, incluyendo un gran número de pacientes, es la comparación del efecto de Aspirina® o placebo sobre la mortalidad, según el signo del Zodíaco correspondiente a la fecha de nacimiento de los pacientes; según este análisis el uso de Aspirina es beneficioso en general, pero no para las personas clasificadas Géminis o Libra, que no se beneficiarían con el uso de este fármaco (Tabla I).

Análisis de subgrupos en estudios aleatorios. Aspirina®: número de muertes. Universidad de Oxford, UK.
Tamaño completo

En la evaluación de tratamientos el estándar de oro es el estudio aleatorio fase III, en el cual la única diferencia entre los grupos que se comparan es el tratamiento evaluado. La ventaja del estudio aleatorio es que si la muestra es superior a mil pacientes se asegura prácticamente un balance entre todos los factores pronósticos conocidos o desconocidos.

El control de los errores estadísticos es fundamental en la evaluación de un tratamiento. Así, en los estudios aleatorios se pueden producir dos tipos de error:

  • Error tipo alfa: ocasiona falsos positivos, lo que lleva a concluir que un tratamiento es beneficioso cuando realmente no lo es.
  • Error tipo beta: corresponde a falsos negativos, lo que conduce a la conclusión de que un tratamiento es ineficaz cuando realmente es eficaz.

Es importante revisar el valor de la significación estadística. Si se obtiene una desviación estándar, equivalente a p = 0,3, es como lanzar una moneda al aire y elegir “cara o sello” o lanzar un dado de tres caras; dos unidades de desviación estándar, equivalentes al 5% convencional (p = 0,05) es como lanzar dos dados y obtener dos veces seis; el efecto es sólo sugerido y se considera un buen resultado moderado para un estudio aleatorio. Una desviación estándar de tres unidades, equivalente a p = 0,003, es como lanzar cuatro dados y obtener cuatro seis. Con cuatro desviaciones estándar, equivalentes a p = 0,0001, se considera como una corroboración científica de la hipótesis inicial.

Resultados falsos positivos y falsos negativos

Hasta hace pocos años los médicos se preocupaban de eliminar los falsos positivos, pero es necesario destacar que el 5% convencional es bastante peligroso porque existe una posibilidad sobre veinte de estar equivocados. En la actualidad los médicos también se están preocupando de los falsos negativos. Por ejemplo, hay tratamientos eficaces, como el tamoxifeno en cáncer de mama, que se podrían haber dejado de utilizar debido a que sólo dos estudios sobre más de veinte demostraron beneficios con el tratamiento; incluso tres de ellos mostraron un efecto deletéreo. Sin embargo, el tamoxifeno es un tratamiento hormonal que se utiliza como adyuvante en el cáncer de mama, con efectos moderados, con reducción relativa del riesgo de muerte de alrededor de 17%, similar a la quimioterapia (16%), a la radioterapia de tórax en cáncer de células pequeñas (14%) y a la quimioterapia con cis-platino en cáncer de pulmón operado (13%). Los beneficios absolutos son del orden de 4% a 6%. Lo interesante es que la asociación de tratamientos eficaces puede tener un efecto multiplicativo; por ejemplo, en cáncer de mama temprano con ganglios positivos la radioterapia adyuvante produce una reducción de la mortalidad de 10%; una paciente que recibe tamoxifeno adyuvante por cinco años y que tiene receptores estrogénicos positivos presenta una reducción de 30%; y en una paciente joven con ganglios positivos que recibe quimioterapia adyuvante la reducción es de 20%. Si se multiplican los efectos de estos tratamientos se obtiene una reducción total de la mortalidad de 50%.

Volviendo a los consensos en Medicina

La medicina basada en ciencia no constituye un problema excepto si los resultados son ambiguos o heterogéneos, lo que genera controversias. Con estas definiciones es posible determinar áreas de consenso y de controversia; sin embargo se debe reconocer que la mayor parte de la información en medicina no se produce en forma científica o no se evalúa en forma apropiada. Aquí aparece el concepto de estado del arte, que es influenciado por aspectos políticos, sociales, económicos y que además depende de los intereses personales y de la moda.

Los consensos pueden ser peligrosos; de hecho el consenso 2007 de St. Gallen entregó recomendaciones sobre las indicaciones de radioterapia post-mastectomía de un panel de expertos incluyendo algunos radioterapeutas. El autor de esta exposición envió una carta al medio que publicó dichas recomendaciones señalando el potencial peligro de ellas “ya que en algunos lugares las podrían aplicar sin considerar que son el resultado de un consenso y no de pruebas científicas”. Los autores de la publicación del consenso respondieron que aquellas recomendaciones eran más seguras que las afirmaciones individuales basadas sobre estudios seleccionados. El autor de la carta en realidad basó su postura sobre estudios aleatorios provenientes de todo el mundo sobre radioterapia post-mastectomía. Esto lleva a preguntarse cómo se seleccionan los participantes de un panel de líderes de opinión. Nadie desconoce que eran expertos reconocidos en todo el mundo. La pregunta es si no hay sesgos en su selección tales como amistad, colaboraciones cercanas, compromiso o por tener una visión similar que los organizadores sobre los temas tratados. La proposición de este autor para evitar sesgos es elegir el panel de manera aleatoria: 40 a 50 expertos entre los dos mil o tres mil que existen en todo el mundo y constituir cuatro grupos de 10 ó 12 personas, también en forma aleatoria, para trabajar en el tema. Luego se compararían los cuatro consensos para definir las áreas de consenso y controversia. Los “líderes de opinión” deberían reconocer en caso de controversia que sus asertos son opiniones de experto, pero sin base científica.

Ejemplos recientes de consensos y revisiones sistemáticas son los siguientes:

  • Umbrales para terapias: Saint Gallen 2009 (2).
  • Guías de ASCO para la reducción del riesgo de cáncer de mama en poblaciones sin riesgo (3).
  • Consenso de ASTRO para las irradiaciones parciales de mama (APBI) (4).
  • Revisión sistemática danesa para APBI (5).
  • Revisión británica del rol de la radioterapia en los tratamientos conservadores al usar terapias sistémicas (6).

En el caso de los umbrales para las terapias de Saint Gallen del año 2009 se reunió un panel de 43 expertos que en sus conclusiones puso énfasis en las terapias sistémicas adyuvantes dirigidas a blancos, de acuerdo a subgrupos definidos por marcadores predictivos. Además se insistió en la importancia de medir de manera muy estricta los receptores estrogénicos (ER) y HER2 y se reconoció la importancia de los marcadores de proliferación, incluyendo los que se identifican en análisis genómicos. Las recomendaciones finales resumidas fueron:

  • Los tratamientos hormonales están indicados para todos los pacientes ER +.
  • La terapia anti-HER2 se indica en pacientes ASCO/CAP HER2+, determinado con buenas técnicas; se pueden utilizar las definiciones de los ensayos clínicos que evaluaron la herceptina.
  • La quimioterapia se utiliza en pacientes con HER2 positivo. En pacientes con ER muy positivo (+++) se puede utilizar hormonoterapia y herceptina, sin quimioterapia; esta conducta parece lógica, pero su utilidad no se ha demostrado en estudios aleatorios.
  • Para las pacientes con tumor triple negativo no existen alternativas validadas, ya que no hay medicamentos o esquemas con efecto comprobado.

En pacientes ER positivo y HER2 negativo la indicación depende del riesgo:

  • En pacientes con bajo nivel de ER y PR se aplica terapia hormonal y quimioterapia; con alto nivel de estos factores sólo se realiza terapia hormonal.
  • Con grado histológico 3 se aplica quimioterapia y terapia hormonal; esto podría ser no útil en el grado 2, y en grado 1 sólo se aplica terapia hormonal.
  • Para los tumores con proliferación alta, se recomienda quimioterapia y terapia hormonal; para baja proliferación, sólo terapia hormonal.
  • Con cuatro o más ganglios positivos se debe realizar quimioterapia y terapia hormonal; con ganglios negativos, sólo terapia hormonal; no sería útil como criterio único la presencia de uno a tres ganglios positivos.
  • Para la infiltración peritumoral extensa se recomienda quimioterapia y terapia hormonal; si está ausente, sólo terapia hormonal.
  • Si el tamaño del tumor es mayor de 5 cm se recomienda quimioterapia y terapia hormonal; si mide 2 cm o menos, sólo terapia hormonal; si mide entre 2 y 5 cm este factor no sería útil como información.
  • Para pacientes con tumores con alta proliferación determinada por genómica se recomienda quimioterapia y terapia hormonal; si es baja, sólo terapia hormonal; si es intermedia, no se considera un dato útil.
  • Si se considera la preferencia del paciente se debe administrar todos los tratamientos disponibles, es decir, quimioterapia y terapia hormonal a una paciente que es muy ansiosa.
  • Si la paciente está muy preocupada por los efectos colaterales, sólo se debería suministrar terapia hormonal.

Este resumen muestra la complejidad de los parámetros que pueden llegar a ser integrados en un consenso y al mismo tiempo como este proceso se aleja de lo que es puramente científico.

Medicina personalizada en el tratamiento del cáncer de mama

El notable desarrollo del área de la biología molecular en los últimos años ha llevado a plantear la hipótesis de que cada paciente es diferente y por lo tanto debe recibir un tratamiento personalizado. Sin embargo: ¿Se sabe lo suficiente sobre cada diferencia? ¿Se sabe cómo determinar el tratamiento personalizado apropiado? ¿Se sabe cómo evaluarlo? En teoría los tratamientos se pueden evaluar considerando características como ER, HER2, presencia o no de ganglios y edad del paciente; no obstante, sólo si los blancos moleculares se conocen perfectamente, que no es lo habitual, sería posible evaluar el efecto del tratamiento en grupos cada vez más pequeños de pacientes; y como en la actualidad el conocimiento que se tiene en esta área aún es limitado, no es posible realizar predicciones infalibles.

En un intento de encontrar predictores seguros se han desarrollado las firmas genómicas (genomics signatures), en series pequeñas de no más de cien pacientes. Entre sus ventajas están su presentación estética, ya que parecen pinturas puntillistas, y el hecho de que producen un alto nivel de publicaciones. Sin embargo, al comparar diferentes firmas genómicas son pocos los genes comunes entre una firma y otra para una misma localización, en el cáncer de mama, por ejemplo, la firma de Amsterdam sólo tiene dos genes comunes con la firma de Rotterdam, sobre más de 70 seleccionados.

En búsqueda de nuevos factores predictivos se están realizando los estudios europeo Mindact (BIG/TRANSBIG) y norteamericano US Intergroup TAILORx trial. Ambos incluyen a miles de pacientes y son de alto costo. Su factibilidad está siendo determinada.

Los estudios de Sotiriou y colaboradores en Bruselas sobre la utilidad de las firmas en el pronóstico mostraron una discordancia de 10% a 20% entre los laboratorios. Los autores concluyeron que las clasificaciones moleculares tienen una reproducibilidad bajo el nivel óptimo, se deben afinar mucho las definiciones, existen pocos genes comunes entre diferentes firmas, se han realizado pocas validaciones y la mayoría de los genes pronósticos son marcadores de proliferación (7).

Michiels y el grupo de investigación del IGR realizaron un estudio en el que volvieron a analizar los datos de los siete principales estudios publicados que han intentado predecir el pronóstico de los pacientes con cáncer sobre la base del análisis genómico. Para ello ampliaron la estrategia estándar, que se basa en la detección de una firma molecular y conjuntos de validación, mediante la formación de varios conjuntos en forma aleatoria para estudiar la estabilidad de la firma molecular y la proporción de errores de clasificación. La información que se obtuvo fue de importancia, ya que el porcentaje de clasificaciones erróneas fue alto y cercano al 50%. La mejor de las series fue la de cáncer de mama de Amsterdam (9) que alcanzó un porcentaje de clasificación errónea en 31% con amplios intervalos de confianza (8).

Precisamente, el estudio pionero de Van’t Veer (9) sobre identificación de genes, publicado en 2002, incluyó a sólo 78 pacientes con cáncer de mama y axila negativa. Se analizaron 20.000 genes y se encontró que 1.000 genes con un error de 5%, o 200 genes con un error menor de 1%, estaban relacionados con el pronóstico (9). Posteriormente se han propuesto varios criterios para ajustar los p-value como el estudio de Michiels et al. citado en el párrafo precedente (8).

En otro estudio (10) con el objetivo de explicar la variabilidad de un estudio pionero en cáncer de mama, se encontró una variabilidad de 0% en un modelo sin factores; con todos los factores convencionales la variabilidad fue 16%; al analizar sólo la firma molecular la variabilidad fue 12% y con los factores convencionales y la firma molecular la variabilidad subió a 19%. Por lo tanto, el valor agregado por la firma molecular para explicar la variabilidad fue sólo 3%.
En resumen, marcadores como los RE y HER2 son buenos factores predictivos del efecto de un tratamiento, pero explican solamente una parte de la variabilidad, por lo lo tanto proporcionan probabilidades y no son determinantes. Las firmas biómicas, sean genómicas, proteómicas o metabolómicas, son una esperanza para el futuro y han abierto un amplio campo de investigación, pero para lograr una aplicación clínica se requieren resultados más robustos.

Las conclusiones de esta presentación sobre, los consensos en Medicina pueden ser las siguientes: estos consensos son prácticamente útiles, ya que evitan la necesidad de leer los artículos originales, lo cual tiene una repercusión positiva en la calidad de vida de los médicos, sus familias y amistades. Por otro lado evitan que se cometan errores mayores, lo cual va sin duda en beneficio del paciente. No obstante, su utilidad es mayor si se utilizan como guías o recomendaciones, y no como leyes.

Dentro de las limitaciones de los consensos está que no siempre coincide la significación estadística con la clínica. En algunos estudios se encuentran diferencias estadísticas y clínicas, pero en otros si bien se encuentra una diferencia estadísticamente significativa, el impacto clínico es limitado. En este caso se debe considerar la toxicidad del tratamiento y su efecto sobre la calidad de vida mediante una evaluación muy cuidadosa, entregando la información completa al paciente. Por ejemplo, en el estudio HERA se encontró una diferencia significativa clínica y estadística, con dos años de seguimiento, a favor del tratamiento con trastuzumab (11). En cambio en el estudio sobre cáncer pulmonar avanzado presentado en 2009 en ASCO, en el que se estudió a 743 pacientes sobrevivientes con cáncer avanzado de pulmón que habían recibido cuatro ciclos de quimioterapia con bevacizumab y luego se subdividieron en dos grupos, el primer grupo de los cuales continuó con bavacizumab y con erlotinib y el segundo, con bevacizumab y placebo, los resultados muestran que el primer grupo tuvo una reducción de 28% de los acontecimientos y de la letalidad, pero que el impacto con el uso de erlotinib fue solamente de cuatro semanas de ganancia, es decir bastante limitado.

Conclusiones

  • El consenso no es parte de la ciencia.
  • En medicina el consenso puede ser peligroso, pero también puede ser útil, especialmente si se basa en un trabajo intensivo y una discusión apropiada por parte de un grupo de especialistas.
  • Los consensos son seguros si no están relacionados con política, economía, actividades sociales o sexuales, que requieren otro tipo de consenso.
  • Son útiles y protectores para los pacientes si se consideran como guías o recomendaciones.
  • Necesitan una actualización periódica.
  • Se debe aceptar que el conocimiento seguro es escurridizo.