¿Qué son los niveles de evidencia?

Objetivo educativo:

Actualmente existe varios sistemas de clasificación en el mundo para los niveles de evidencia y la fuerza de recomendación, por lo cual trae una gran inconsistencia para los desarrolladores de guías clínicas. Un gran número de investigadores utilizan el sistema GRADE para clasificar la calidad de evidencia disponible. Los niveles de evidencia provienen no solo la solidez del diseño del estudio sino también la veracidad de los resultados finales.

Desarrollo del tema:

El nivel o grado de evidencia clínica es un sistema jerarquizado, basado en las pruebas o estudios de investigación, que ayuda a los profesionales de la salud a valorar la fortaleza o solidez de la evidencia asociada a los resultados obtenidos de una estrategia terapéutica.

El BMJ (British Medical Journal, una revista médica publicada semanalmente en el Reino Unido por la Asociación Médica Británica​) ha solicitado en sus “Instrucciones para los autores” en bmj.com que los autores de preferencia utilicen el sistema de evaluación y desarrollo de calificación (GRADE) para calificar la evidencia al presentar un artículo de guías clínicas. 

GRADE tiene ventajas sobre los sistemas de calificación. Otros sistemas comparten algunas de estas ventajas, pero ninguno, aparte de GRADE, los combina a todos.

Ventajas de GRADE sobre otros sitemas:

El sistema GRADE presenta aspectos diferenciales que se pueden resumir en tres:

  1. Inicialmente categoriza los desenlaces de interés (ej. muerte) y su importancia relativa;
  2. Luego evalúa la calidad de la evidencia en cuatro categorías para cada uno de los desenlaces para obtener una calidad global de evidencia;
  3. Finalmente gradúa la fuerza de las recomendaciones en dos únicas categorías (recomendaciones fuertes o débiles).

En el caso concreto de las revisiones sistemáticas el sistema GRADE se ha adoptado por parte de la Colaboración Cochrane para evaluar la calidad de la evidencia de sus revisiones sistemáticas. Las ventajas de esta aproximación son:

  • Está desarrollado por un grupo internacional y representativo de desarrolladores de guías clínicas de varias partes del mundo.
  • Muestra conjuntamente la calidad de la evidencia y el grado de recomendación. Por ejemplo: mala calidad, mala recomendación.
  • Hay una evaluación explícita de la importancia de los resultados de estrategias de manejo alternativas.
  • Existen criterios claros para bajar y subir los puntajes de calidad de la evidencia.
  • Existe un proceso transparente del paso de la evidencia a la recomendación.
  • Hay un reconocimiento explícito de los valores y preferencias de los autores, lo que también pudiera ser una desventaja.
  • Finalmente, se presenta una interpretación clara y pragmática de recomendación fuerte o débil para médicos, pacientes y autoridades.

Calidad de evidencia:

Los expertos clínicos y las organizaciones que ofrecen recomendaciones a la comunidad clínica a menudo han cometido errores como resultado de no tener suficientemente en cuenta la calidad de la evidencia.  Durante una década, las organizaciones recomendaron que los médicos indicasen a las mujeres postmenopáusicas a utilizar la terapia de reemplazo hormonal. Muchos médicos de atención primaria aplicaron debidamente este consejo en sus prácticas.

La creencia de que dicha terapia disminuyó sustancialmente el riesgo cardiovascular de las mujeres impulsó esta recomendación. Si se hubiera aplicado un sistema riguroso de calificación de la calidad de la evidencia en ese momento, habría demostrado que debido a que los datos provenían de estudios observacionales con resultados inconsistentes, la evidencia de una reducción en el riesgo cardiovascular era de muy baja calidad. El reconocimiento de las limitaciones de la evidencia habría atenuado las recomendaciones. En última instancia, los ensayos controlados aleatorios han demostrado que la terapia de reemplazo hormonal no reduce el riesgo cardiovascular e incluso puede aumentarlo.

La atención insuficiente a la calidad de la evidencia pone en riesgo pautas y recomendaciones inapropiadas que pueden llevar a los médicos a actuar en detrimento de sus pacientes. Reconocer la calidad de la evidencia ayudará a prevenir errores.

Clasificación de los niveles de evidencia según GRADE:

El sistema GRADE clasifica la calidad de la evidencia en niveles: alta, moderada, baja y muy baja. Se presenta en la Tabla 1.

Alta calidadEs poco probable que la investigación adicional cambie nuestra confianza en la estimación del efecto.
Calidad moderadaEs probable que la investigación adicional tenga un impacto importante en nuestra confianza en la estimación del efecto y puede cambiar la estimación.  
Baja calidadEs muy probable que la investigación adicional tenga un impacto importante en nuestra confianza en la estimación del efecto y es probable que cambie la estimación.
Muy baja calidadCualquier estimación del efecto es muy incierta.
Tabla 1 – Calidad de la evidencia y definiciones

La evidencia que proviene de estudios clínicos aleatorizados se presupone como de alta calidad, pero este nivel puede disminuir en función de:

  • Limitaciones del estudio.
  • Inconsistencia de los resultados.
  • Evidencia indirecta.
  • Imprecisión.
  • Sesgo de reporte.

Existen además otros cinco factores que pueden justificar disminuir la calidad y otros tres que pueden justificar aumentar la calidad de la evidencia ( Tabla 2 ).

Diseño de estudioCalidad de la evidencia inicialEn ensayos clínicos, disminuir siEn estudios observacionales, aumentar solo siCalidad del conjunto de la evidencia
Ensayos clínicos aleatorizadosAltaLimitaciones en el diseño o la ejecuciónFuerza de asociaciónAlta
– Importantes– Fuerte
– Muy importantes– Muy fuerte
InconsistenciaGradiente dosis-respuestaModerada
– Importante– Presente
– Muy importanteConsideración de los posibles factores de confusión que:
Incertidumbre en que la evidencia sea directaBaja
– Importante– Habrían reducido el efecto
– Muy importante– Sugerirían un efecto espurio si no hay efecto
Estudios observacionalesBajaImprecisiónMuy baja
–Importante
–Muy importante
Tabla 2 – Evaluación de la calidad de la evidencia según el tipo de diseño de los estudios. Adaptada de: Balshem et al.

Fuerza de la recomendación:

Indica el grado en que se puede estar seguro de que la adhesión a la recomendación producirá beneficio o daño. Cuando los efectos deseados de la intervención claramente superan o no superan a los indeseados, la recomendación es fuerte. Por otro lado, si los efectos de la intervención son más dudosos, o si la calidad de la evidencia es baja, la recomendación es débil.

Además de la calidad de las pruebas, varios otros factores que afectan a si las recomendaciones son fuertes o débiles ( Tabla 3 ).

Factores que afectan la fuerza de una recomendación:

FactorEjemplos de recomendaciones fuertesEjemplos de recomendaciones débiles.
Calidad de la evidenciaMuchos ensayos aleatorios de alta calidad han demostrado el beneficio de los esteroides inhalados en el asma.Solo las series de casos han examinado la utilidad de la pleurodesis en el neumotórax
Incertidumbre sobre el equilibrio entre los efectos deseables e indeseables.La aspirina en el infarto de miocardio reduce la mortalidad con una toxicidad, inconveniencia y costo mínimosLa warfarina en pacientes de bajo riesgo con fibrilación auricular produce una reducción pequeña del accidente cerebrovascular, pero aumenta el riesgo de sangrado e inconvenientes sustanciales
Incertidumbre o variabilidad en valores y preferenciasLos pacientes jóvenes con linfoma invariablemente asignarán un mayor valor a los efectos de la quimioterapia que prolongan la vida que a la toxicidad del tratamientoEs posible que los pacientes mayores con linfoma no asignen un mayor valor a los efectos de la quimioterapia que prolongan la vida que a la toxicidad del tratamiento.
Incertidumbre sobre si la intervención representa un uso racional de los recursosEl bajo costo de la aspirina como profilaxis contra el accidente cerebrovascular en pacientes con ataques isquémicos transitoriosEl alto costo del clopidogrel y de la combinación de dipiridamol y aspirina como profilaxis contra el accidente cerebrovascular en pacientes con ataques isquémicos transitorios.
Tabla 3 – Factores que afectan la fuerza de recomendación.

La fuerza de la recomendación se mueve en un continuo que va de fuertemente recomendado a fuertemente no recomendado, con las recomendaciones débiles alrededor de la ausencia de efecto.

Calidad global de la evidencia:

Cada recomendación depende de la evidencia sobre resultados identificados al hacer preguntas clínicas y considerado como importante para los pacientes. El sistema GRADE realiza una valoración global de la evidencia, esta valoración global expresa la confianza general que tenemos en los desenlaces de interés y corresponde al menor nivel de confianza de los desenlaces claves.

Así, si para responder una pregunta tenemos 3 desenlaces claves, 2 de ellos con una calidad alta y otro con calidad moderada, la calidad global de la evidencia será valorada como moderada. Una recomendación fuerte está sustentada con una confianza alta o moderada en las estimaciones del efecto para los desenlaces claves y una recomendación débil, en una confianza baja o muy baja.

Conclusión:

El sistema GRADE proporciona un enfoque integral, explícito, y metodología transparente para calificar la calidad de evidencia y solidez de las fuerzas de recomendaciones sobre el manejo de pacientes. No evaluar el nivel de evidencia, puede llevar a recomendaciones prejudiciales a los pacientes, por lo que las guías clínicas o recomendaciones debieran informar cuál es la calidad de la evidencia que sustenta la intervención, y si dichas recomendaciones son fuertes o débiles.

Referencias:

  1. Howard Balshema, *, Mark Helfanda,b , Holger J. Sch€unemannc , Andrew D. Oxmand , Regina Kunze , Jan Brozekc , Gunn E. Vistd , Yngve Falck-Ytterf , Joerg Meerpohlg,h , Susan Norrisi , Gordon H. Guyattc. 2011. GRADE guidelines: 3. Rating the quality of evidence. https://www.sciencedirect.com/science/article/abs/pii/S089543561000332X
  2. David Atkins1, Martin Eccles2, Signe Flottorp3, Gordon H Guyatt4,David Henry5, Suzanne Hill5, Alessandro Liberati6, Dianne O’Connell7,Andrew D Oxman3, Bob Phillips8, Holger Schünemann4,9, Tessa TanTorres Edejer10, Gunn E Vist*3, John W Williams Jr11 and The GRADE Working Group3. 2004. Systems for grading the quality of evidence and the strength of recommendations I: Critical appraisal of existing approaches The GRADE Working Group. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2335261/
  3. Daniela Pérsico T.1 y David Torres P.2. 2014. Niveles de evidencia y grados de recomendación: Sistema GRADE. https://revistachilenadeanestesia.cl/PII/revchilanestv43n04.18.pdf
  4. Andrea Juliana Sanabriaa, David Rigaua, Rafael Rotaecheb, Anna Selvaa, Mercè Marzo-Castillejoc y Pablo Alonso-Coelloa. 2015. Sistema GRADE: metodología para la realización de recomendaciones para la práctica clínica. https://www.sciencedirect.com/science/article/pii/S0212656714000493?via%3Dihub
  5. Luigi Terraccianoa, Jan Brozekb, Enrico Compalatic and Holger Schu¨nemann. 2010. GRADE system: new paradigm. https://journals.lww.com/co-allergy/Abstract/2010/08000/GRADE_system__new_paradigm.19.aspx

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *