Revisión sistemática

← vista completa

Evaluación del test de Conners y de inteligencia en el diagnóstico del déficit atencional en población entre 6 y 19 años: revisión sistemática

Conners’ and intelligence scales in the diagnosis of attention deficit disorder in population between 6 and 19 years: a systematic review

Resumen

Introducción: para el trastorno de déficit de atención e hiperactividad (TDAH), se utilizan los criterios del DSM-IV; sin embargo, este resulta complejo y puede ser costoso. En consecuencia, han surgido diversas escalas específicas o no de conducta (pruebas psiconeurológicas) por lo que surge un particular interés de conocer su utilidad en el TDAH. Objetivo: identificar, sintetizar y evaluar la mejor evidencia disponible sobre la utilidad del test de Conners e inteligencia en el diagnóstico de TDAH en la población entre 6 y 19 años. Métodos: se realizó una revisión sistemática de estudios de pruebas diagnósticas que evaluaron la validez diagnóstica, confiabilidad y efectividad de la realización del test de Conners y test de inteligencia en el diagnóstico de TDAH en población entre 6 y 19 años, usando la base de datos de PubMed, LILACS, Cochrane, DARE y National Guideline Clearinghouse, publicados hasta febrero de 2012, en inglés y español. A los artículos que cumplieron con los criterios de inclusión, se les evaluó su calidad metodológica según patrones estándar para estudios de revisión y de pruebas diagnósticas, por dos investigadores en forma independiente y consensuada. Resultados: de los 110 estudios encontrados inicialmente, se incluyeron diez estudios: tres revisiones sistemáticas de mediana calidad y adicionalmente siete artículos primarios de pruebas diagnósticas de buena calidad, y cinco guías clínicas basadas en evidencias que abordan este tema. Conclusiones: la validez, confiabilidad y efectividad del test de Conners y de inteligencia son heterogéneas, y las guías de práctica clínica no recomiendan su utilización. El uso de dichos métodos se recomienda para la valoración integral del individuo con este trastorno.

Introducción

El trastorno por déficit de atención e hiperactividad (TDAH) ha sido definido como un trastorno del autocontrol, caracterizado clínicamente por dificultades en la esfera de la atención, exceso de actividad motora y deficiencias en el control de los impulsos (DSM-IV). Desde que en 1902 Still1 describió por vez primera un grupo de 20 niños con diversos grados de agresión, hostilidad, conducta desafiante, desatención e hiperactividad, los intentos por conceptualizar y validar un síndrome que pueda agrupar este conjunto de síntomas no han tenido fin. El diagnóstico de TDAH es bastante complejo y requiere la observación de la conducta del niño o adolescente en diferentes ambientes. Por tanto, para su adecuado diagnóstico se requiere la participación de padres, maestros y de una evaluación clínica realizada por un profesional de la medicina entrenado y con experiencia clínica, razón por la cual en ocasiones resulta ser costoso. Para el diagnóstico se utilizan los criterios del DSM-IV2 y, de forma complementaria, escalas de evaluación de la conducta y test de inteligencia, entre otros, que pudieran determinar el diagnóstico.

Esta revisión tiene como objetivo identificar, sintetizar y evaluar la mejor evidencia disponible sobre la utilidad de los test de Conners e inteligencia en el diagnóstico de TDAH en la población entre 6 y 19 años.

Métodos

La revisión sistemática se desarrolló en las siguientes etapas: se realizó el planteamiento de la pregunta en forma explícita lo que permitió realizar la búsqueda bibliográfica en bases de datos electrónicas, con criterios de inclusión referidos al grupo etario de estudio (entre 6 y 19 años), se estudiaron revisiones sistemáticas, guías de práctica clínica basadas en evidencia, informes de evaluación de tecnologías en salud y estudios primarios. Se elaboraron criterios de exclusión y de análisis crítico y la síntesis de resultados se presenta con tablas resumen.

El nivel de evidencia se establece según criterios del Grupo SIGN (Harbour 2001)3.

Los detalles del método se pueden consultar en Anexo 1.

Planteamiento de las preguntas en forma explícita

  • ¿Cuál es el nivel de validez y confiabilidad del test de Conners en la detección del déficit atencional en población entre 6 y 19 años?
  • ¿Cuál es la efectividad comparada de la realización y no realización del test de inteligencia para la detección del déficit atencional en la población entre 6 y 19 años?

Resultados

La estrategia de búsqueda realizada en forma independiente por los dos investigadores permitió identificar un total 110 estudios, sin obtener discrepancia: 16 revisiones sistemáticas, 88 estudios primarios sobre prueba diagnóstica y 6 guías clínicas. Esta consistió en combinar las palabras claves en términos MeSH o descriptores, más los límites descritos, según su disponibilidad en las bases de datos mencionadas.

Luego de revisar el título o el resumen disponibles, se encontró que muchos artículos no tenían relación al tema, no se trataban de estudios de diagnósticos o se encontraban duplicados por estar incluidos en las revisiones sistemáticas en el caso de los estudios primarios. En menor proporción se encontraron estudios duplicados en las diferentes bases de datos, en idiomas diferentes al inglés o español, o no se disponía del texto completo. Luego de esta exclusión, quedaron seleccionados 15 estudios: tres RS, siete EP y cinco guías clínicas, los cuales se analizaron individualmente (ver Tabla I).

Fuente Revisiones sistemáticas encontradas (analizadas) Estudios primarios encontrados (analizados) Guías clínicas (analizadas)
MEDLINE 04 (3) 72 (7) 0
DARE / HTA Database 07 (1) 0 1 (0)
LILACS 0 16 (0) 0
COCHRANE (español e inglés) 0 0 0
NCG 05 (0) 0 05 (5)
Total encontrados 16 (3) 88 (7) 06
Excluidos con sus causas o duplicados 13 excluidas por: 1 duplicada, 3 revisiones narrativas,
1 adulto, 3 no relacionadas al tema y 5 guías clínicas
81 excluidos por: 12 incluidos en RS, 34 no relacionados al tema, 2 no disponible texto completo, 5 de idioma diferente y 28 no de prueba diagnóstica. 1 duplicado
Total seleccionados 03 07 05

Tabla I. Bases de datos y estudios encontrados y seleccionados para evaluación del test de Conners e inteligencia en TDAH en la población entre 6 y 19 años.

Características de los estudios seleccionados (Anexo 2)

1. Para el test de Conners se encontró una revisión sistemática, Green 19994, realizada en Estados Unidos. La población incluida fue niños de 6 a 12 años. Las bases de datos empleadas fueron MEDLINE y PsycINFO, complementada por búsqueda manual por expertos de 1980 a 1997 en idioma inglés. Los autores predefinieron criterios de inclusión y exclusión y realizaron análisis crítico formal de cada estudio incluido. El estándar de referencia utilizado para el diagnóstico de TDAH fue DSM o ICD-10. Los autores evaluaron cuatro aspectos, entre ellos la prevalencia de TDAH y sus comorbilidades en población general y en clínicas de atención primaria, y la exactitud de las escalas, entre ellas la de Conners en base a cuatro estudios efectuados por el propio Conners en 1997.

En cuanto a los estudios primarios, se obtuvieron cuatro de pruebas diagnósticas: Charach 20005; Deb 20086; Snyder 20087 y Busing 19988. De estos, dos se realizaron en Estados Unidos; los otros se efectuaron en Canadá y Reino Unido. En total se evaluaron 2.170 niños. En todos los estudios se utilizó el estándar de referencia con criterios del DSM-IV y como screening evaluado el test de Conners para profesores y padres en su versión completa, y abreviada en forma independiente. En el artículo de Deb la población fue de niños con discapacidad intelectual; para el resto de los análisis se trató de poblaciones heterogéneas.

2. En el caso del test de inteligencia, se obtuvieron dos revisiones sistemáticas Romine 20049 y Homack 200410. Entre ambas se evaluaron 49 estudios, con una búsqueda bibliográfica limitada y especificada de 1984 a 2002 en las bases de datos de PsychInfo, MEDLINE y ERIC. Además, con falta de descripción en el análisis crítico de los estudios realizados, consideraron población con TDAH por los criterios del DSM-IV que tenían comorbilidades asociadas. Las pruebas evaluadas fueron la de Stroop (de atención usando color y palabras) y Wisconsin (clasificación de categorías y flexibilidad ante los cambios), respectivamente.

Además, se recogieron tres estudios primarios, dos de ellos (Pineda 200711 de Colombia y Oie 199912 de Noruega) evaluaron baterías de pruebas psicológicas para inteligencia, funciones motoras, verbales y ejecutivas, entre otras. Estos estudios de casos y controles, abarcaron 629 pacientes en el de Pineda11 y 69 pacientes en el de Oie12 con diagnósticos de TDAH por criterios del DSM-IV y comorbilidades asociadas. El tercer estudio, de casos y controles, es el de Wodka13, efectuado con 123 niños en Estados Unidos en que se aplica el test de inteligencia y el D-KEFS para funciones ejecutivas, tanto en niños como niñas con TDHA. En los tres estudios existe la dificultad de la descripción del test realizado y las poblaciones son heterogéneas con comorbilidades asociadas.

Adicionalmente a estos estudios, están descritos otros 12 en la revisión sistemática de Green 19994, a saber: August 1989; Barkley 1994; Breen 1989; Carter 1995; Cohen 1989; Dykman 1991; Fischer 1995; Grant 1990; Halperin 1993; Horn 1989; Loge 1990 y Seidel 1991, los que ya fueron analizados en sus características de calidad y limitaciones en el primer punto.

Resultados de los estudios seleccionados

Test de Conners
Los resultados reportados en la revisión sistemática de Green 19994, cuando analizó los cuatro estudios de Conners 1997, tienen una sensibilidad del 94% para detectar TDHA en condiciones ideales.

El estudio de Charach 20005 reporta que si el test de Conners ofrece un score de 60 o más en todas las subescalas, tiene una sensibilidad de 91 a 94%. Si tiene un score de 60 o menos en las subescalas de M y N, la probabilidad es del 10%. Si el score es de 80 o más ofrece una especificidad de 88 a 93%, pero en la realización del postest no da diagnóstico. Los mayores falsos positivos son trastornos del lenguaje y de la lectura. Concluyen, además, que el test de Conners para profesores es limitado para establecer diagnóstico de déficit de atención.

En Deb 20086, que evaluó a niños con discapacidad intelectual (ID) cuando se aplicó el test de Conners CPRS y CTRS (padres y profesores, respectivamente), tenemos con CPRS y un puntaje de 42, lo que proporciona una sensibilidad de 0,9 y una especificidad de 0,67 con un área bajo la curva de 0,84. Del mismo modo, Conners CTRS y puntaje de 40 proporciona una sensibilidad de 0,69 y una especificidad de 0,67, con un área bajo la curva de 0,71. No hubo diferencias estadísticamente significativas entre los niños con ID con y sin TDAH en la puntuación total de la CPRS, ni en la mayoría de sus resultados parciales. Se concluye entonces, que el CPRS puede distinguir entre los niños con ID con y sin TDAH, pero no las puntuaciones del CTRS. Por lo tanto, es necesario desarrollar un instrumento de detección de TDAH específico para los niños con ID.

En el estudio de Snyder 20087, la prevalencia de TDAH en la muestra estudiada fue del 61%. Comorbilidades se observaron en el 66% de los pacientes con TDAH e incluye el estado de ánimo, ansiedad y trastornos de aprendizaje. Las escalas Conners y de TDAH específicas arrojaron una sensibilidad de 38 a 79% y una especificidad de 13 a 61%. Si bien los padres o maestros identifican el TDAH mediante las escalas que fueron evaluadas, éstas reducen su precisión cuando se aplica a una muestra clínica diversa.

Y, por último, en Busing 19988, la sensibilidad del cuestionario de Conners ASQ es de 64% (60 T score) y un poco más baja (50%) para 70 T scores. La especificidad va de 73% (60 T score) a 85% (70 T score). El valor predictivo positivo va de 59 a 66% para 60 T score y 70 T score, respectivamente. El valor predictivo positivo varía de 74% (70 T score) a 78% (60 T Score). La eficiencia de las medidas de tamizaje utilizadas varía ligeramente en los diferentes niveles de corte en un rango de 72 a 74% para ADDES y de 70 a 72% para el ASQ.

Test de inteligencia
En las revisiones de Romine 20049 y Homack 200410, los resultados fueron mostrados basados en el cálculo del tamaño del efecto para cada variable en cada estudio, con la finalidad de obtener una medida común en todos los estudios. En Romine, para las cuatro variables, el tamaño del efecto ponderado fue moderado: porcentaje de preguntas correctas (0,55), número de categorías (0,51), total de errores (0,58) y errores reiterativos (0,52). La variable “respuesta reiterativa”, con un tamaño del efecto 0,46, se situó muy cerca del moderado. Las variables “falta para mantener set” y “errores no reiterativos” demostraron un tamaño del efecto pequeño. La variable “test completo correcto” muestra un efecto negativo; sin embargo dicho resultado debe interpretarse con cuidado ya que sólo dos estudios aportan datos sobre esta variable. Estos resultados indican que las variables “porcentaje de preguntas correctas”, “número de categorías”, “total de errores” y “errores reiterativos” son moderadamente sensibles a las funciones ejecutivas de los niños con déficit atencional.

En Homack, la mayoría de los estudios seleccionados muestran un tamaño del efecto negativo, lo que indica que en el grupo con déficit atencional está afectado negativamente el rendimiento en comparación con el grupo control. Los valores del tamaño del efecto ponderados van desde -0,52 a -0,75, indicando que las variables del test son moderadamente sensibles a los déficit neuropsicológicos manifestados por los niños con déficit atencional y comorbilidades asociadas.

En Pineda 200711, el análisis de varianza de los resultados (p<0,05) ha demostrado que los niños con déficit atencional obtuvieron puntajes más bajos en los test, en relación al grupo control. El análisis de covarianza (edad, sexo, grado escolar), muestra un tamaño del efecto pequeño a moderado. El análisis discriminante de las variables mostró una precisión del 61,9% en clasificar la muestra (sensibilidad 48%, especificidad 72%), con un valor predictivo positivo de 55,5% (clasificación correcta de casos) y valor predictivo negativo de 65,6% (correcta clasificación de controles) del test.

En Oie 199912, el test D-KEFS mostró para las niñas un valor predictivo positivo de 0,60 y negativo de 0,71. Para los niños el valor predictivo positivo fue de 0,55 y el valor predictivo negativo fue de 0,62. En este estudio se encontraron diferencias entre los grupos, lo que sugiere una limitada sensibilidad y especificidad de la D-KEFS para la clasificación de los niños con TDAH.

Wodka 200813 encontró en la batería de test psicológicos analizada, una clara diferencia en el patrón de rendimiento en los diferentes grupos. El análisis de varianza muestra una diferencia significativa en las variables: flexibilidad-abstracción (F=7,05, df=2, 62, p=0,002); procesamiento auditivo y distractibilidad (F=7,08, df=2,65, p=0,002); aprehensión (F=4,20, df=2,65, p=0,02); función motora (F=8,62, df=2,65, p<0,001); organización espacial (F=3,68, df=2,65, p=0,03); memoria visual (F=16,45, df=2,64, p<0,001); atención y procesamiento visual-motor (F=11,34, df=2,65, p<0,001); aprendizaje y memoria verbal =8,65, df=2,65, p<0,001). No se observaron diferencias significativas para las variables atención sostenida y atención selectiva. Los sujetos con déficit atencional tuvieron resultados marcadamente disminuidos con respecto al grupo control (normales) en las variables: aprendizaje y memoria verbal, atención y procesamiento visual motor, procesamiento auditivo y distractibilidad y aprehensión.

En la revisión de Green 19994, específicamente en los 12 estudios que evaluaron rendimiento, no se demostró relación alguna con el TDAH, con una baja sensibilidad, menor del 70%.

Discusión

Test de Conners
Se encontró una revisión sistemática, Green 1999, realizada en Estados Unidos con limitaciones en la búsqueda bibliográfica y con buen análisis crítico de los estudios incluidos. Sólo consideró cuatro estudios efectuados por el mismo Conners en 1997 en pacientes con TDHA en condiciones ideales, arrojando una alta sensibilidad del 94%, sin aporte de especificidad, ni valores predictivos. De los otros cuatro estudios (Charach 2000; Deb 2008; Snyder 2008 y Busing 1998), dos fueron realizados en Estados Unidos y los otros en Canadá y el Reino Unido, respectivamente. Estos cuatro estudios se efectuaron con poblaciones más heterogéneas en cuanto a comorbilidades, y si bien todos usaban independientemente los criterios de evaluación a través del DSM-IV o ICD-10 del TDHA, se obtuvo rangos muy amplios de sensibilidad y especificidad.

Las cinco guías clínicas basadas en evidencias, tres de Estados Unidos (ICSI 201014) con 128 referencias; AACAP 200715, con 190 referencias y Kaiser 200916, con 123 referencias), se limitan a revisar algunas bases de datos, entre ellas MEDLINE. Las europeas como NICE 200817 y SIGN 200918 sí realizan una búsqueda más amplia. Estas guías clínicas presentan limitaciones temporales a estudios en inglés y no recomiendan el test de Conners para el diagnóstico del TDAH. Se hace la salvedad de que en la guía de Kaiser 200916 y la de NICE 200817, se considera el test de Conners como prueba valiosa y como parte de la evaluación que se debe realizar, incluyendo otras escalas conductuales. Estas apreciaciones se recogen de estudios no analíticos y de opinión de expertos en dichas guías.

Test de inteligencia
En esta prueba diagnóstica se obtuvo la mayor cantidad de artículos, un total de 64, de los cuales 61 estudios están incluidos en las tres revisiones sistemáticas encontradas: Green 1999, Homack y Romine 2004. Estos estudios, al igual que las cinco guías clínicas, refieren que estos test no son obligatorios para diagnosticar TDAH, pero deben realizarse si el historial del paciente sugiere baja capacidad cognoscitiva general o bajo rendimiento.

Conclusiones

La evidencia científica disponible sobre la validez y confiabilidad del test de Conners como herramienta de diagnóstico en TDAH presenta rangos amplios y variables; en sensibilidad va de 38 a 94%, de acuerdo al puntaje de las escalas y comorbilidades asociadas. Las guías de práctica clínica no la recomiendan.

Los test de inteligencia pueden ser utilizados en la valoración integral del individuo con TDAH, pero no se recomienda como herramienta de diagnóstico.

Fortalezas y limitaciones de la revisión

Se realizó una amplia búsqueda sin límites de tiempo, en una amplia base de datos electrónica, en dos idiomas predominantes. Los artículos a evaluar se analizaron críticamente en forma individual e independiente por los investigadores.

Se encontraron pocos estudios que evalúen los métodos analizados para el diagnóstico de TDAH. Los pocos que existen tienen limitaciones metodológicas en cuanto a la búsqueda o análisis crítico de los artículos incluidos en el caso de las revisiones sistemáticas. Con respecto a los estudios primarios, las poblaciones incluidas eran muy heterogéneas con comorbilidades y, en ocasiones, incluyeron adultos. Además, existen limitaciones en la descripción adecuada de los métodos aplicados y en el cálculo de la concordancia. Por lo tanto, se sugiere efectuar estudios de alta calidad metodológica para evaluar los test de Conners y pruebas psicológicas como métodos diagnósticos en el TDAH.

Implicaciones para la práctica 

No se recomienda la realización del test de Conners ni del test de inteligencia como métodos diagnósticos en el TDAH. El uso de dichos métodos diagnósticos se recomienda para la valoración integral del individuo con este trastorno.

 Nivel de evidencia 2

Notas

Esta revisión sistemática forma parte de un grupo de 8 revisiones sistemáticas sobre diagnóstico y tratamiento de trastorno por déficit atencional e hiperactividad, todos los cuales se publican en este número de Medwave. Los artículos son:

  1. Evaluación del test de Conners y de inteligencia en el diagnóstico del déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.07.5469)
  2. Evaluación del electroencefalograma, tomografía computarizada y resonancia magnética como métodos diagnósticos para déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.08.5470)
  3. Evaluación de la efectividad y seguridad de la atomoxetina para déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.07.5471)
  4. Evaluación de la efectividad y seguridad del metilfenidato para déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.08.5472)
  5. Evaluación de la efectividad y seguridad de la anfetamina para déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.08.5473)
  6. Evaluación de la efectividad y seguridad de los antidepresivos para déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.08.5474)
  7. Evaluación de la efectividad y seguridad de los alfa agonistas para déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.08.5475)
  8. Evaluación de la efectividad y seguridad del metilfenidato de acción larga versus acción corta en el déficit atencional en población entre 6 y 19 años: revisión sistemática (doi: 10.5867/medwave.2012.08.5476)

Fernando Novoa entrega una visión de contexto a estos artículos en su editorial, Revisiones sistemáticas en aspectos de diagnóstico y tratamiento del síndrome de déficit atencional, también publicado en este número (doi: 10.5867/medwave.2012.08.5478).

Anexos

Anexo 1: Métodos 
Anexo 2: Lista de criterios de evaluación
Anexo 3: Características de los estudios seleccionados
Anexo 4: Resultados de los estudios seleccionados
Anexo 5: Abreviaturas

Conflictos de intereses

Los autores han completado el formulario de declaración de conflictos de intereses del ICMJE traducido al castellano por Medwave, y declaran no haber recibido financiamiento para la realización del artículo/investigación; no tener relaciones financieras con organizaciones que podrían tener intereses en el artículo publicado, en los últimos tres años; y no tener otras relaciones o actividades que podrían influir sobre el artículo publicado. Los formularios pueden ser solicitados contactando al autor responsable.