Evidencias Medicas : Es válida esta prueba diagnóstica ?Medicina General y Familiar

GH Guyatt, PX Tugwell, DH Feeny, RB Haynes, M Drummond . . A framework forclinical evaluation of diagnostic technologies . Canadian Medical AssociationJournal 1986 ;134 :587-94 .

Introducción

Tanto la práctica de la medicina comola provisión de cuidados de salud depende continuamente de un diagnósticopreciso basado en la utilización de pruebas diagnósticas.Éstas pueden ser radiológicas (incluyendo ecografíaso resonancias magnéticas nucleares), de laboratorio (incluyendobioquímica, hematología, bactereología, virología,inmunología o pruebas genéticas) o fisiológicas (mediciónde temperatura, test de orina, pruebas de esfuerzo).
¿Cómo se puede saber si una prueba responde a lo que sepide de ella? ¿Cuáles son las reglas de la evidencia frentea las cuales una prueba nueva (o ya existente) debe ser valorada? Contamoscon reglas para tratamientos (Bandolier12), y por tanto, no sería pedir demasiado si contamos con reglaspara el diagnóstico.

Criterios metodológicos

Bandolier ha encontrado un fantástico documento [1] que establecesiete criterios metodológicos de calidad para las pruebas diagnósticas.Se buscaron artículos publicados en Lancet, British Medical Journal,New England Journal of Medicine y Journal of the American Medical Associationdesde 1978 hasta 1993 para ver cuántos trabajos sobre pruebas diagnósticascumplían estos criterios (¡y para aquellos que no puedan aguantarel suspense, la respuesta es que no muchos!).
Este trabajo no es de una lectura fácil ni cómoda. Paraaquellos de nosotros que estamos implicados en realizar pruebas diagnósticas,se trata de un duro recordatorio del poco tiempo que empleamos en pensary de cuánto tiempo en "pedir y gastar". Para los que las utilizamostambién se trata de un duro recordatorio de cuánta fe ponemosa menudo en un cifra o una opinión, quizá sin pensar en elpeso que habría que darle a esa cifra.
Por estas y otras muchas razones se trata de una publicaciónque conviene conseguir en la biblioteca y leer a texto completo, y luegotenerla a mano para consultarla. Bandolier resume el artículo aquípara asegurarse de su comprensión y para valorarlo en su justa medida.

Los siete criterios

Criterio 1: Las características de la población
La sensibilidad o especificidad de un test depende de las característicasde la población estudiada (ver Bandolier3). Cambie usted la población y cambiarán estos índices.Los datos informados de sensibilidad y especificidad, que son evaluadosen poblaciones con una tasa significativa de enfermedad, pueden no seraplicables en otras poblaciones diferentes en las que se utilice la prueba.
Para que este criterio se cumpla el artículo debe contener informaciónsobre tres de estos cuatro aspectos: Distribución de edad, sexo,resumen de los síntomas clínicos iniciales y/o estadíode la enfermedad, y criterios de elección para los pacientes queentran en el estudio.
Criterio 2: Subgrupos adecuados
La sensibilidad y la especificidad pueden representar valores promediospara una población determinada. A menos que el problema para elcual se utiliza el test haya sido definido con mucha precisión,aquellas pueden variar en diferentes subgrupos poblacionales. Para quela prueba pueda ser utilizada con éxito deberían tenerseen cuenta distintos niveles de precisión según los distintossubgrupos existentes en la población estudiada.
Este criterio se cumple cuando se informa sobre la precisiónde la prueba en relación con cualquier subgrupo demográficoo clínico (por ejemplo en pacientes sintomáticos versus pacientesasintomáticos).
Criterio 3: Evitar el sesgo de selección
Este tipo de sesgo puede producirse cuando los pacientes con los resultadospositivos o negativos de una prueba son derivados de forma preferente paraverificar el diagnóstico mediante otras prueba considerada patrónoro..
Los autores del trabajo discuten esto en profundidad debido a una discrepanciainicial a la hora de aplicar este criterio. Dan muchos ejemplos. Uno deellos fue un nuevo test diagnóstico con DNA para detectar un ungen del cáncer de mama, que se administró a los pacientesbiopsiados con cáncer de mama y a pacientes controles biopsiadossin cáncer. Puesto que la biopsia puede solicitarse preferentementeen mujeres con una historia familiar de cáncer de mama, el grupode "casos" contendrá un factor clínico que por símismo puede estar asociado con el nuevo test con DNA.
Para que este criterio se cumpla en los estudios de cohortes, todoslos sujetos deberían de haber sido asignados para recibir tantoel test diagnóstico como el patrón oro, bien mediante unprocedimiento directo o mediante el seguimiento clínico. En losestudios de casos y controles, la validez del criterio depende de si eltest diagnóstico precede o es posterior a la aplicación delpatrón oro. Si lo precede el criterio se cumple en caso de que laverificación de la enfermedad se realice en la serie consecutivade los pacientes estudiados sin tener en cuenta los resultados del testdiagnóstico. Si el test diagnóstico es a continuacióndel patrón oro, el criterio se cumple si los resultados del testse estratifican de acuerdo a los factores clínicos que podíanestar implicados según el tipo de patrón oro.
Criterio 4: Evitar el sesgo de medición
Este tipo de sesgo podría introducirse si la prueba diagnósticao el patrón oro se realizan sin tomar precauciones para garantizarla objetividad en su interpretación, algo similar al ciego en elcaso de los ensayos clínicos para tratamiento. Se puede evitar siel test y el patrón se interpretan de forma separada por personasindependientes que desconocen los resultados dados por una y otra.
Para que se cumpla este criterio, tanto en estudios de cohortes comoen estudios de casos controles, debe afirmarse explícitamente quela evaluación de los dos test fue realializada de forma independiente.
Criterio 5: Precisión de los resultados
La precisión de la sensibilidad y la especificidad depende del númerode pacientes evaluados. Igual que otras medidas, el resultado estimadodebe tener unos intervalos de confianza alrededor del mismo, que se calculanfacilmente.
Para que se cumpla este criterio, los intervalos de confianza o el errorestandar deben estar reflejados independientemente de la magnitud.
Criterio 6: Presentación de resultados indeterminados
No todos los tests dan lugar a un sí o un no como respuesta, a vecesdan lugar a resultados equívocos o indeterminados. La frecuenciade resultados indeterminados limitará la aplicabilidad de la pruebao la hará más cara si da lugar a otros procedimientos diagnósticosposteriores. La frecuencia de resultados indefinidos y el modo en el quese usan en el cálculo de la precisión de la prueba constituyenuna información de importancia crítica para conocer la eficaciade la misma.
Para que este criterio se cumpla el trabajo debe reflejar de forma apropiadatodos los resultados positivos, negativos o indeterminados generados duranteel estudio, así como si los resultados indeterminados se incluyerono excluyeron al calcular los indicadores de precisión de la prueba.
Criterio 7: Reproductibilidad de la prueba
Las pruebas no siempre dan el mismo resultado, por motivos relacionadoscon la variabilidad del test o la interpretación del observador.Los motivos y el impacto de este asunto deben ser tenidos en cuenta.
Para que se cumpla este criterio en pruebas que requieren interpretacióndel observador, al menos alguno de los test debería ser evaluadocon alguna medida que resuma la variabilidad inter-observador. Para pruebassin interpretación del observador, el criterio se cumple cuandose refleja una media que resuma la variabilidad del instrumento.

¿Se cumplieron los criterios?

Entre 1978 y 1993 los autores encontraros 112 artículos, predominantementecon pruevas de tipo radiológico o inmunológico. Se cumplieronde forma consistente pocos criterios, oscilando entre un 46% que evitabanel sesgo de selección y un 9% reflejando la precisión ensubgrupos.

Aunque se producía una mejoría en la calidad de los artículosa lo largo del tiempo, incluso en periodos más recientes, sóloel 24% cumplía cuatro criterios y sólo el 6% llegaba a losseis criterios.

Implicaciones

Lo autores sugieren que, dado que estos informes se publicaron en las supuestascuatro más importantes revistas médicas del mundo, se estásobreestimando el verdadero cumplimiento de los criterios de calidad enla evaluación y publicación de las pruebas diagnósticas.Puede ser cierto, y siéndolo, estos hallazgos dan lugar a un motivoreal de preocupación respecto a la repugnancia tecnológicaque suponen las pruebas diagnósticas de valor no probado.
La evaluación sistemática de pruebas diagnósticasantes de su utilización debería dar lugar a beneficios envarias áreas:
Eliminación de pruebas de mala calidad o inútiles antes deque estén disponibles de forma generalizada.
Mejora en la calidad de la información relativa a pruebas diagnósticas.
Redución del gasto sanitario.
Mejora de la atención al paciente.Dada la confianza que se pone en las pruebas diagnósticas en lapráctica médica moderna, lo correcto sería que laspruebas se sometieran a una evaluación de calidad estandarizadaantes de que se generalice su utilización [2]. Esto podríaparecer draconiano pero, ¿hay otro camino?

Traducido por

Santiago Alvarez.Madrid
número de la base de datos: b26-2

Evidencias Medicas

Sitios Principales

30 enero, 2014

Es válida esta prueba diagnóstica ?

No hay comentarios.:

Publicar un comentario