Artículo de revisión

← vista completa

¿Conocemos las propiedades diagnósticas de las pruebas usadas en COVID-19? Una revisión rápida de la literatura recientemente publicada

Do we know the diagnostic properties of the tests used in COVID-19? A rapid review of recently published literature

Resumen

COVID-19 ha traído muerte y enfermedad a gran parte del mundo. Los gobiernos deben desplegar estrategias para tamizar la población y aislar los casos sospechosos. Las pruebas diagnósticas son críticas en la vigilancia epidemiológica, pero no se conoce la exactitud (sensibilidad y especificidad) y la utilidad clínica (impacto sobre los desenlaces de salud) de los métodos diagnósticos actuales usados para la detección del SARS-CoV-2. Realicé una búsqueda rápida en PubMed/MEDLINE para encontrar estudios sobre las pruebas diagnósticas de laboratorio y de diagnóstico viral rápido. Después de correr las estrategias de búsqueda, encontré 47 artículos elegibles que son los que uso para esta revisión, en que comento las características de las pruebas y sus limitaciones. No encontré artículos que aborden la utilidad clínica de las pruebas actualmente usadas para la detección del COVID-19, lo que implica que estamos librando una batalla sin tener un conocimiento adecuado de cuál es la proporción de falsos negativos que resultan de los tests que hoy se aplican. No debemos ignorar esta dificultad, dado que podría obstaculizar los esfuerzos nacionales para contener la pandemia con arreglo a la aplicación de test diagnósticos a los casos sospechosos comunitarios.

Introducción

A finales de 2019, el mundo conoció de la existencia de una nueva y letal cepa de coronavirus, que posteriormente se denominó SARS-CoV-2, y que estaba causando muerte y enfermedad en importantes segmentos de población china, particularmente en la ciudad de Wuhan. El 11 de marzo de 2020, la Organización Mundial de la Salud (OMS) declaró que la enfermedad causada por este nuevo virus, el COVID-19, era una pandemia. Al momento de escribir este artículo, se han reportado casi tres millones de casos de COVID-19 y más de 200 000 de muertes en todo el mundo. Una revisión sistemática que aunó 656 pacientes, encontró que las principales manifestaciones de COVID-19 incluyen fiebre, tos y disnea, y 32,8% de los casos presentan síndrome de distrés respiratorio agudo; 20,3% de los casos requieren cuidados intensivos; y 6,2% van a desarrollar shock[1].

Esta enorme carga sobre nuestros sistemas hospitalarios ha llevado a la implementación de estrategias agresivas para suprimir la diseminación del virus en la población general. La intensidad de las estrategias, eso sí, ha sido marcadamente disímil entre los países afectados[2],[3]. Independientemente de las estrategias desplegadas por los gobiernos nacionales y locales, las más exitosas se han basado en el uso de diagnóstico de laboratorio y en el posterior aislamiento de los casos sospechosos. Según la OMS, el “testeo de laboratorio para COVID-19 es fundamental para hacer el seguimiento del virus, conocer su epidemiología, informar para el manejo de los casos, y suprimir la transmisión” (véase Technical Guidance). Sin embargo, la información sobre cuáles son los tests que los diferentes países están utilizando para detectar casos y llevar la vigilancia epidemiológica no está fácilmente disponible. Hay aún menos información sobre las propiedades de los test diagnósticos actualmente desplegados en el campo, y existen reportes de prensa que se refieren al problema de los falsos negativos[4].

Todavía no conocemos las características del SARS-CoV-2. Un tiempo de incubación prolongado podría ser responsable de la rápida diseminación e infectividad de esta cepa de coronavirus[5]. No obstante, esto fue refutado por un reciente análisis sobre una base de datos más grande de pacientes que no encontró diferencias estadísticamente significativas en la media de los tiempos de incubación para SARS-CoV, MERS-CoV y SARS-CoV-2[6]. Así mismo, se ha visto que muchos individuos asintomáticos tienen un test positivo para SARS-CoV-2[7]. Un modelamiento estadístico que se realizó en la población del crucero Diamond Pincess encontró que 17,9% (intervalo de confianza: 15,2 a 20,2%) de las personas que tuvieron un test positivo para SARS-CoV-2 eran asintomáticos, pero esto podría estar subestimado dado que no todos los pasajeros fueron testeados[8]. Por otra parte, ha sido reportada una tasa alta de falsos negativos sobre ácido nucleico del SARS-CoV-2 para el test que se usa mayormente en tamizaje para COVID-19, la reacción en cadena de la polimerasa de transcripción reversa (RT-PCR, por sus siglas en inglés) sobre la base de muestras tomadas de la orofaringe[9],[10],[11],[12]. En una carta al editor, un autor describe un caso de tres muestras consecutivas negativas para ácido nucleico SARS-CoV-2, caso que finalmente fue confirmado como COVID-19 por la neumonía diagnosticada con tomografía computarizada que mostró una opacificación típica de vidrio esmerilado, apareciendo posteriormente un cuarto test RT-PCR que resultó positivo[13]. En consecuencia, muchos reportes ahora aconsejan que el diagnóstico de COVID-19 debería incluir una imagen tomográfica de pulmón junto con los test de PCR en casos altamente sospechosos[14],[15].

Las técnicas de muestreo para detectar el ácido nucleico viral de la vía aérea alta también han sido cuestionadas debido a una supuesta alta tasa de falsos negativos[7],[9]. Una revisión de la literatura publicada en chino sobre las experiencias previas con SARS, MERS e influenza A, señaló que existía una ausencia de recomendaciones uniformes sobre el método que se debe emplear para tomar la muestra del tracto respiratorio alto, y encontró que el aspirado nasofaríngeo tenía una mayor positividad dentro de las dos semanas del inicio de los síntomas, mientras que los frotis nasales y orofaríngeos combinados eran menos riesgosos para los profesionales de la salud durante el procedimiento de toma de muestra[16].  Hay quienes sugieren que las muestras para detección de infección viral se debiesen tomar desde el tracto respiratorio bajo de los pacientes, incluyendo desgarro y líquido del lavado broncoalveolar[9],[17].

Los métodos de laboratorio para detectar la presencia de SARS-CoV-2 en una muestra biológica tienen ventajas y desventajas. El aislamiento del virus se puede lograr con cultivos celulares. Los test rápidos basados en antígenos, serología y ensayos moleculares todos han sido activamente desplegados para la vigilancia epidemiológica o están siendo probados para implementación en el punto de atención en salud[17],[18]. Considerando la necesidad de tener datos fiables sobre las propiedades de los test de los diferentes métodos que actualmente se están introduciendo para el control de la pandemia COVID-19, decidí llevar a cabo una revisión de la literatura para conocer la exactitud y utilidad clínica de los métodos actuales para tamizaje para detectar el SARS-CoV-2 en casos sospechosos.

Métodos

Busqué en PubMed/MEDLINE con las palabras clave “covid 19”, “sensitivity”, “screening”, y “detection” (véase Tabla 1) hasta el 26 de marzo de 2020. Utilicé los siguientes términos MeSH para construir las búsquedas: “covid 19”, “detection”, “screening”, “sensitivity”, “rt pcr”, y “diagnosis”. Luego busqué en las referencias de los artículos seleccionados para encontrar las referencias primarias a las propiedades de test diagnóstico.

Los criterios de inclusión fueron artículos que reporten sobre test diagnósticos de laboratorio y diagnóstico viral rápido.

Los criterios de exclusión fueron reportes de caso, artículos de opinión, cartas al editor, artículos que reportan hallazgos clínicos, estrategias de vigilancia, técnicas de imágenes, epidemiología, estrategias de mitigación, artículos que abordan subgrupos poblacionales (ejemplo: pediatría, mujeres embarazadas) o desenlaces no relacionados con diagnóstico (ejemplo: salud mental), abordajes terapéuticos y guías clínicas. También se excluyeron los artículos en chino si no era posible encontrar una traducción razonable. Para esta revisión rápida, también excluí los preprintsdebido a su carácter preliminar y falta de validación por pares.

Resultados

Después de correr las estrategias de búsqueda y de tamizar los títulos, encontré 47 artículos elegibles para tamizaje del resumen (Tabla 1). Después de evaluar los artículos elegibles aplicando los criterios de inclusión y exclusión, seleccioné 13 artículos para revisión del texto completo. Todos los artículos fueron publicados en el primer trimestre de 2020 y solo ocho cumplieron con los criterios de inclusión y exclusión[15],[19],[20],[21],[22],[23],[24],[25]. Usé los 47 artículos para la preparación de esta revisión, además de referencias que fui encontrando durante la redacción de este artículo. La búsqueda principal la realicé el 26 de marzo.

Estrategias de búsqueda y resultados.
Tamaño completo

Análisis de los hallazgos

El propósito de esta revisión es conocer la sensibilidad y especificidad de los test que actualmente se están usando para la detección del SARS-CoV-2 en el mundo. Estos test son diagnósticos in vitro que analizan muestras tomadas del cuerpo humano (como suero, saliva, desgarro, sangre, orina, deposiciones). Se toman decisiones en base a los resultados obtenidos. En consecuencia, los profesionales de la salud de primera línea deberían conocer cuáles son las probabilidades de que haya falsos negativos y falsos positivos; en otras palabras, la exactitud de las pruebas. Una prueba diagnóstica nos dará un resultado correcto en la medida de que es positiva en presencia de enfermedad (verdadero positivo) y negativa en ausencia de enfermedad (verdadero negativo); tanto falsos positivos como falsos negativos entregarán información equívoca[26]. Los test para tamizaje, que se aplican en poblaciones asintomáticas, deberían ser fáciles de administrar, rápidos en entregar resultados, de bajo costo y, lo más importante, altamente sensibles. Actualmente, el patrón de oro para la detección del SARS-CoV-2 es el RT-PCR porque cuando la muestra contiene virus o fragmentos virales, incluso en cantidades ínfimas, debería brindar una sensibilidad de 100%. Sin embargo, debido a una serie de falencias que comentaré más adelante, nuestras formas actuales de testeo para este novel coronavirus podrían estar quedando cortas.

RT-PCR sobre el ácido nucleico viral

Las técnicas que usan la RT-PCR para diagnosticar COVID-19 son las más predominantes. Si bien puede detectar la presencia o ausencia de ácido nucleico viral y, en consecuencia, directamente confirmar la infección viral en una muestra humana, está sujeta a varias limitaciones. Estos test solo se pueden procesar en laboratorios certificados, lo que significa que, en la mayoría de los países, los resultados están llegando con retrasos perjudiciales para los pacientes y para los sistemas de salud y de vigilancia. Adicionalmente, hay factores analíticos y preanalíticos que pueden comprometer la calidad del testeo con RT-PCR para la detección del SARS-CoV-2, así reduciendo la exactitud diagnóstica del test[27].

Chan y cols en Hong Kong reportó el desarrollo de un nuevo ensayo que actúa sobre una región diferente del genoma del SARS-CoV-2 (genes RdRp/Hel, S, y N) usando muestras in vitro y clínicas[22]. Doscientos setenta y tres muestras fueron recolectadas de 15 pacientes de Hong Kong (8 hombres y 7 mujeres; rango de edad de 37 a 75 años) con COVID-19 confirmado por laboratorio. Los autores reportaron que el ensayo fue altamente sensible y específico para la detección del RNA in vitro del SARS-CoV-2, pero no fue probado en pacientes que no tuviesen COVID-19. No se conoce la utilidad clínica de este test.

Autores koreanos desarrollaron una forma de recolección de muestra fácil vía un hisopo faríngeo de autoaplicación sobre el cual realizaron RT-PCR y purificación del RNA con Trizol, lo que testearon en 12 voluntarios humanos mayormente asintomáticos[24]. Los autores entregan instrucciones detalladas sobre cómo tomar la muestra de la orofaringe. El control positivo con RNA viral del SARS-CoV-2 fue extraído de células Vero infectadas con un clon viral. El propósito del estudio fue la creación de un protocolo de detección altamente sensible para identificar los verdaderos negativos para SARS-CoV-2, pero el alcance limitado de la validación realizada impide cualquier generalización de este estudio. 

Liu y cols llevaron a cabo un análisis retrospectivo de test de ácido nucleico viral con RT-PCR tomado de 4880 casos sospechosos de COVID-19 que se presentaron desde fines de enero hasta mediados de febrero en el Hospital de Renmin de la Universidad de Wuhan[20], usando los hisopos nasales y faríngeos, y el lavado broncoalveolar y desgarro. El principal resultado de este estudio fue una positividad de 38% para SARS-CoV-2 en esta población, que aumentó a 57% en la subpoblación que se atendía en las clínicas de la fiebre. Este estudio solo nos permite determinar, para esta población, la proporción de test positivos en una población con una alta probabilidad de tener COVID-19 debido a la presencia de síntomas de infección respiratoria o de haber tenido un contacto estrecho con pacientes COVID-19. No hubo seguimiento de los casos para determinar si todos los test positivos eran efectivamente pacientes COVID-19, ni si los test negativos correspondían realmente a ausencia de enfermedad. En otras palabras, este estudio no entrega los datos que se requieren para calcular la sensibilidad y la especificidad de este test en una población en que la enfermedad es prevalente.

Otro grupo en Korea desarrolló y evaluó el ensayo llamado Loop-Mediated Isothermal Amplification (LAMP) para detectar RNA genómico del SARS-CoV-2 y encontró que los ensayos RT-LAMP pueden detectar cantidades tan bajas de SARS-CoV-2 como 100 copias, con lo que certifican una exactitud técnica muy alta[28]. Sin embargo, la aplicabilidad clínica de esta técnica aún no ha sido estudiada para SARS-CoV-2.

Inmunoensayos

Los inmunoensayos son test que identifican anticuerpos específicos en la sangre del paciente. Li y cols desarrollaron un inmunoensayo de flujo lateral para uso en atención de pacientes que puede detectar IgM e IgG en la sangre humana en tan solo 15 minutos[25]. Interesantemente, este test fue aplicado en ocho centros chinos de seis provincias, tanto en personas infectadas como no infectadas, abarcando un total de 522 casos, de los cuales 397 habían sido previamente diagnosticados con COVID-19 confirmado con test PCR, y 128 eran pacientes no infectados. Trescientas cincuenta y dos resultaron positivos, dando una sensibilidad de 88,66%. La especificidad se calculó en 90,63% (12 falsos positivos). El artículo no reporta el espectro de pacientes, como tampoco si el patrón de oro se aplicó independientemente.

Otro estudio abordó el tema de la evolución en el tiempo de los IgA, IgM e IgG anti-SARS-CoV-2 utilizando un ensayo ELISA en 208 muestras de plasma recolectadas de dos cohortes de pacientes: 82 casos confirmados y 58 casos probables de hospitales de Wuhan y Beijing[19]. La mediana de la duración de la detección de IgM e IgA fue de cinco días (rango, 3 a 6), mientras que la IgG se detectó 14 días después del inicio de los síntomas (rango, 10 a 18) con una positividad de 85,4%, 92,7% y 77,9%, respectivamente. Este estudio ayuda a conocer la respuesta humoral al virus y, así, situar la capacidad del inmunoensayo para detectar alguna respuesta en un paciente con COVID-19.

Limitaciones de los test diagnósticos

Los estudios incluidos todos fueron realizados durante la epidemia COVID-19, posteriormente definida como pandemia. No es lo mismo cuando los test son llevados a cabo con fines de tamizaje, a cuando se hacen con fines diagnósticos (para confirmar o descartar enfermedad cuando hay una elevada probabilidad pretest de la enfermedad). Establecer la sensibilidad o especificidad de un test no es necesariamente independiente de la prevalencia, porque los métodos que se usan para tomar las muestras (ejemplo, desgarro, o hisopo nasofaríngeo) pueden determinar una mayor o menor chance de recoger restos de virus, y esto puede ser diferente si la población que está siendo muestreada tiene enfermedad más o menos avanzada[26].

Si bien hay reportes que hacen alusión a las evaluaciones analíticas de los test para detectar SARS-CoV-2 así como los algoritmos que se deben aplicar[23],[29],[30],[31], no resultan útiles para el proceso de toma de decisiones clínica y epidemiológica, y no reportan resultados de campo, con pacientes reales. La mayoría de los papers publicados sobre COVID-19 y diagnóstico no son estudios realizados en casos sospechosos comunitarios, los que podrían aportar resultados pragmáticos sobre sensibilidad y especificidad.

Conclusión y palabras de cierre

Los profesionales de la salud en la primera línea de la batalla contra la pandemia por el SARS-CoV-2 deberían estar conscientes del riesgo de error de clasificación producto de las consecuencias que puede haber si se deja de detectar la enfermedad en personas infectadas. Cuando sabemos que un test para tamizaje es altamente sensible, entonces podemos descartar la enfermedad cuando el test es negativo, con confianza. ¿Necesitamos seguir estudiando un caso asintomático con resultado de laboratorio positivo para confirmar que es un verdadero positivo? Probablemente no, dado que la principal indicación va a ser la cuarentena si hay otros elementos de la historia que nos dan una alta probabilidad pretest de que el paciente tenga efectivamente COVID-19, como haber viajado a un país de alto riesgo, haber tenido contacto con una persona positiva para SARS-CoV-2, o haber asistido a una reunión masiva en un lugar encerrado en los días o semana previos. No obstante, China ha reportado que las tomografías computarizadas de pulmón son más sensibles para COVID-19 que los test RT-PCR y, hasta hace poco, se usaban como práctica estándar en el diagnóstico de la enfermedad[32]. Si bien hay muchos artículos que describen el diagnóstico molecular de este novel virus[9],[33],[34], mi revisión no encontró ningún reporte sobre la utilidad clínica de los test actualmente en uso para tamizaje de COVID-19.

Aún no existe un consenso claro sobre testeo. Si bien el test con RT-PCR está masivamente en uso, sus limitaciones incluyen la necesidad de instalaciones de laboratorio de más alto nivel, una técnica correcta de toma de muestra con el hisopo, y vías clínicas desde la muestra del paciente hasta el resultado de laboratorio, libres de errores. Así mismo, hay una amplia variedad de estrategias respecto de cuándo aplicar los test. Algunos países tienen programas comunitarios de amplio alcance para detectar la mayor cantidad de casos posibles, incluyendo los asintomáticos, mientras que otros países solo aplican los test a pacientes que llegan al hospital. Algunos países incluso han considerado la entrega de “carnet de alta” para COVID-19 basados en test sobre anticuerpos[35], lo que ha generado una cierta controversia después de que la OMS declaró que “actualmente no hay evidencia de que las personas que se han recuperado del COVID-19 y que tengan anticuerpos estén protegidas frente a una segunda infección”[36]. Por supuesto que para cuando este artículo se encuentre publicado, muchos países que seguían una estrategia determinada podrían haberse cambiado a otra. A la fecha de mi revisión de la literatura, no había estudios grandes poblacionales que incluyeran a sujetos enfermos y sanos que nos permitiera calcular las propiedades estadísticas de positividad en enfermedad y negatividad en salud. Se debe llevar a cabo más investigación sobre el testeo diagnóstico para COVID-19 en la población general dado que aún estamos bajo un manto de incertidumbre.

Actualmente, el mundo se encuentra en una carrera para encontrar soluciones que la humanidad requiere en diagnóstico, prevención y terapia de este novel coronavirus. Cada día están saliendo nuevos artículos sobre cualquiera de estas preguntas críticas, muchos publicados en revistas de alto perfil. No debemos dejarnos llevar por una natural expectativa de encontrar rápidamente la solución exitosa porque eso abre el camino a evaluaciones acríticas de las intervenciones que se están proponiendo. Ha habido reportes sobre tratamientos con base a grupos pequeños sin los debidos controles[37] y muchos nuevos test diagnósticos para SARS-CoV-2 están siendo explorados y desplegados en terreno. Cada día aparecen crónicas de prensa que alaban los esfuerzos universitarios para producir en masa ventiladores mecánicos y cualquier comunicado de prensa es inmediatamente tomado por los medios de comunicación y, lamentablemente, también por altas autoridades. Muchos de estos experimentos no van a resistir el paso del tiempo, y podría no haber, al final, suficiente evidencia para apoyar el uso continuado de pruebas diagnósticas o intervenciones. La comunidad académica y de investigadores debe insistir en que se sigan métodos robustos en la investigación clínica y altos estándares de reporte en la comunicación de los resultados, aún en estos tiempos de dolor y sufrimiento, porque no podemos darnos el lujo de repetir los errores del pasado[38]. Las autoridades sanitarias y los líderes políticos de estos tiempos son llamados a tomar las mejores decisiones para el beneficio de sus pueblos y de sus comunidades, basándose en la mejor evidencia disponible.