5.1. Lectura crítica con listas de chequeo (CONSORT, CASP)
5.2. Evaluación de relevancia clínica vs. significancia estadística
5.3. Traslación de la evidencia a la práctica individual
5.4. Limitaciones y generalización a distintos contextos
5.1. LECTURA CRÍTICA CON LISTAS DE CHEQUEO (CONSORT, CASP)
Introducción
La lectura crítica es la piedra angular de la medicina basada en evidencia. No se trata únicamente de leer artículos, sino de analizarlos de manera estructurada para decidir si sus resultados son válidos, relevantes y aplicables.
Para ello, las listas de chequeo han demostrado ser herramientas muy útiles porque:
- Establecen criterios objetivos que reducen la subjetividad del lector.
- Estandarizan la evaluación de ensayos en distintos contextos académicos y clínicos.
- Ahorran tiempo al clínico al proporcionar preguntas clave que guían la interpretación.
Las dos más utilizadas a nivel internacional son:
- CONSORT (Consolidated Standards of Reporting Trials).
- CASP (Critical Appraisal Skills Programme).
1. CONSORT (Consolidated Standards of Reporting Trials)
Origen y evolución
- Surge en 1996 como respuesta a la mala calidad en el reporte de ensayos clínicos.
- Actualizaciones en 2001 y 2010 refinaron su estructura.
- Actualmente, muchas revistas de alto impacto (The Lancet, NEJM, JAMA, BMJ) exigen el CONSORT como requisito de publicación.
Objetivos
- Mejorar la transparencia en la comunicación de los ensayos.
- Permitir que los lectores identifiquen sesgos y juzguen la calidad metodológica.
- Favorecer la reproducibilidad de la investigación.
Estructura principal
- Diagrama de flujo CONSORT:
- Describe las cuatro fases:
- Reclutamiento (elegibilidad).
- Asignación (randomización).
- Seguimiento (pérdidas y abandonos).
- Análisis final (incluidos en ITT y por protocolo).
- Permite identificar si hubo pérdidas diferenciales que afecten la validez.
- Describe las cuatro fases:
- Lista de verificación de 25 ítems:
- Título y resumen claros.
- Introducción con justificación científica.
- Métodos: aleatorización, cegamiento, cálculo de tamaño muestral.
- Resultados: desenlaces primarios y secundarios, efectos adversos.
- Discusión: interpretación equilibrada, limitaciones reconocidas.
Extensiones CONSORT
- CONSORT-Harms: reporte de efectos adversos.
- CONSORT-Cluster: ensayos por conglomerados.
- CONSORT-Noninferiority: estudios de no inferioridad y equivalencia.
- CONSORT-AI: ensayos que incorporan inteligencia artificial en intervenciones.
👉 Esto demuestra que CONSORT es dinámico y se adapta a nuevas metodologías.
2. CASP (Critical Appraisal Skills Programme)
Origen
- Desarrollado en Oxford, Reino Unido, en los años 90.
- Diseñado para profesionales de la salud no especializados en investigación, como herramienta práctica de lectura crítica.
Objetivo
- Ayudar al clínico a responder tres grandes preguntas:
- ¿Son válidos los resultados del ensayo?
- ¿Qué encontraron los investigadores?
- ¿Son aplicables a mis pacientes?
Estructura de la lista de chequeo CASP para ensayos clínicos
- 11 preguntas en 3 bloques:
Bloque A: Validez interna
- ¿Se asignaron los pacientes de forma aleatoria?
- ¿La asignación fue ocultada?
- ¿Los grupos eran similares al inicio?
- ¿Se cegaron pacientes, médicos y evaluadores?
- ¿Se siguieron todos los pacientes hasta el final?
Bloque B: Resultados
6. ¿Qué desenlaces se midieron y fueron apropiados?
7. ¿Cuál fue el tamaño del efecto (RR, OR, NNT)?
8. ¿Se reportaron intervalos de confianza y significancia estadística?
Bloque C: Aplicabilidad
9. ¿Se parecen los pacientes del ensayo a los míos?
10. ¿Son factibles la intervención y el seguimiento en mi contexto?
11. ¿Los beneficios superan riesgos, costos y carga para mis pacientes?
Ventajas de CASP
- Breve (aplicable en 10–15 minutos).
- Guía la discusión en clubes de revista.
- Es adaptable a múltiples tipos de estudio (ensayos, cohortes, revisiones sistemáticas).
3. Comparación entre CONSORT y CASP
| Aspecto | CONSORT | CASP |
|---|---|---|
| Enfoque | Reporte del estudio (autor/editor) | Evaluación crítica (lector/médico) |
| Objetivo | Garantizar transparencia y exhaustividad en la publicación | Juzgar validez, resultados y aplicabilidad |
| Usuarios | Investigadores, editores de revistas | Clínicos, docentes, estudiantes |
| Formato | 25 ítems + diagrama de flujo | 11 preguntas en 3 bloques |
| Fortalezas | Detecta omisiones y asegura completitud | Práctico, directo, aplicable en consulta |
| Limitaciones | No juzga aplicabilidad clínica | Depende de la calidad del reporte inicial |
👉 Son complementarios:
- CONSORT asegura que el ensayo esté bien contado.
- CASP permite decidir si vale la pena aplicarlo a mi paciente.
4. Ejemplo práctico
Supongamos un ensayo de un nuevo antihipertensivo:
- CONSORT: me permitirá verificar si el estudio fue transparente en su aleatorización, cegamiento, pérdidas y desenlaces. Si no reporta el cálculo de tamaño muestral o el flujo de pacientes, sospecho sesgo.
- CASP: me permitirá preguntarme si mis pacientes (muchos con obesidad, diabetes y acceso irregular a medicación) se parecen a los del ensayo. También si la reducción de la presión arterial es clínicamente relevante y si el fármaco es coste-efectivo en Perú.
5. Uso en docencia y práctica clínica
- Docencia:
- En clubes de revista, se asigna CONSORT a un grupo (evaluar reporte) y CASP a otro (evaluar aplicabilidad).
- Se comparan hallazgos en plenaria, enriqueciendo la discusión.
- Práctica clínica:
- Un médico internista puede aplicar la guía CASP en 10 minutos antes de decidir si incorporar un nuevo fármaco a su arsenal terapéutico.
- Los residentes aprenden a desconfiar de la estadística aislada y a pedir consistencia metodológica.
5.2. EVALUACIÓN DE RELEVANCIA CLÍNICA VS. SIGNIFICANCIA ESTADÍSTICA
Introducción
Durante décadas, la mayoría de lectores clínicos se han quedado en el dato del p-valor para decidir si un resultado “vale” o no. Sin embargo, la estadística moderna y la medicina basada en evidencia (MBE) han mostrado que este enfoque es reductor y peligroso.
- Significancia estadística: responde a la pregunta “¿la diferencia observada puede explicarse por azar?”.
- Relevancia clínica: responde a la pregunta “¿esta diferencia es lo suficientemente grande como para importar en la vida real del paciente?”.
👉 La clave está en no confundir lo improbable con lo importante.
1. Significancia estadística
Definición
Un resultado es “estadísticamente significativo” cuando la probabilidad de que se deba al azar (p-valor) es menor que un umbral predefinido (usualmente 0,05).
Limitaciones del p-valor
- Dependencia del tamaño de muestra:
- En estudios muy grandes, diferencias minúsculas alcanzan p<0,05.
- En estudios pequeños, efectos relevantes pueden no ser “significativos”.
- No mide magnitud del efecto: solo dice si hay diferencia, no cuánto importa.
- No mide aplicabilidad clínica: puede ser significativo en el laboratorio pero irrelevante en la práctica.
Ejemplo clásico
- Ensayo con 30.000 pacientes: fármaco reduce la presión sistólica 1,2 mmHg, p<0,001.
- ¿Importa? Probablemente no: ese cambio mínimo no reduce mortalidad ni eventos cardiovasculares.
👉 Conclusión: el p-valor es un filtro inicial, no un criterio de decisión clínica.
2. Relevancia clínica
Definición
Es el grado en que el efecto observado impacta en la salud, calidad de vida o pronóstico del paciente.
Criterios clave
- Tamaño del efecto (effect size): ¿cuán grande es la diferencia?
- Medidas absolutas:
- ARR (Reducción absoluta del riesgo).
- NNT (Número necesario a tratar).
- NNH (Número necesario para dañar).
- MCID (Minimal Clinically Important Difference): diferencia mínima percibida por el paciente como útil.
- Balance riesgo-beneficio: no basta con beneficio, hay que evaluar costo y seguridad.
Ejemplo
- Un nuevo anticoagulante reduce ictus en 2% absoluto (NNT=50).
- Riesgo de hemorragia mayor aumenta en 0,5% (NNH=200).
- Balance neto favorable, clínicamente relevante.
3. Medidas prácticas de evaluación
a) Reducción relativa vs. absoluta
- RRR (Reducción relativa de riesgo): suele sonar impresionante.
- ARR (Reducción absoluta de riesgo): es la que importa clínicamente.
Ejemplo:
- Mortalidad: 2% vs. 1%.
- RRR=50%, pero ARR=1% (NNT=100).
- Un médico informado debe mirar el NNT, no la RRR.
b) Intervalos de confianza (IC)
- Expresan la precisión del estimado.
- IC estrecho = mayor confianza.
- Si el IC cruza el valor nulo (RR=1, diferencia=0), el hallazgo no es concluyente.
Ejemplo:
- HR=0,80, IC95%: 0,78–0,82 → resultado sólido.
- HR=0,80, IC95%: 0,55–1,15 → resultado incierto, no concluyente.
c) MCID
- Ejemplo en dolor crónico: reducción de ≥2 puntos en EVA (escala visual análoga) es el umbral clínicamente significativo.
- Ensayo muestra reducción de 0,8 puntos con p<0,01 → estadísticamente significativo, clínicamente irrelevante.
4. Ejemplos históricos
- CAST trial (1989, antiarrítmicos):
- Reducían arritmias ventriculares (significativo).
- Pero aumentaban mortalidad (clínicamente devastador).
- Intensificación del control glicémico en UKPDS:
- Reducción de HbA1c de 0,9% (p<0,001).
- Clínicamente relevante porque redujo complicaciones microvasculares, no solo un biomarcador.
- ROCKET-AF vs. ARISTOTLE (anticoagulantes):
- Ambos significativos.
- ARISTOTLE mostró además reducción de mortalidad total → clínicamente más atractivo.
5. Interpretación integrada
- Significancia sin relevancia clínica:
- Resultado “bonito en papel” pero sin utilidad real.
- Relevancia clínica sin significancia estadística:
- Puede ser un efecto real pero estudio insuficiente (subpoderado).
- Requiere confirmación en estudios más grandes o metaanálisis.
- Ideal:
- Resultado estadísticamente significativo y clínicamente relevante, con IC estrecho y coherente con la fisiopatología.
6. Aplicación práctica para el clínico
Al leer un ensayo, preguntarse:
- ¿El efecto fue estadísticamente significativo? (p, IC).
- ¿El efecto fue clínicamente importante? (ARR, NNT, MCID).
- ¿Los beneficios superan los riesgos y costos? (NNT vs. NNH).
- ¿El hallazgo cambia mi práctica o es solo un dato curioso?
👉 Ejemplo aplicado en Perú/LatAm:
- Un fármaco antidiabético muestra reducción de HbA1c de 0,5% (p<0,001).
- Pero no reduce hospitalizaciones ni mortalidad y cuesta 20 veces más.
- Conclusión: significativo pero no relevante en la práctica local.
5.3. TRASLACIÓN DE LA EVIDENCIA A LA PRÁCTICA INDIVIDUAL
Introducción
La medicina basada en evidencia (MBE) busca cerrar la brecha entre lo que se publica en revistas científicas y lo que ocurre en la consulta médica diaria. Sin embargo, el paso de la evidencia global a la decisión individual no es automático.
- Los ensayos clínicos se hacen en entornos controlados, con pacientes seleccionados.
- La práctica real se da en escenarios heterogéneos: multimorbilidad, polifarmacia, recursos limitados, adherencia variable.
👉 La traslación clínica implica adaptar los hallazgos a cada paciente, combinando:
- Evidencia científica sólida.
- Juicio clínico del médico.
- Valores, preferencias y contexto del paciente.
1. Del ensayo a la consulta: pasos clave
Paso 1. Analizar validez y aplicabilidad
- ¿El estudio tiene validez interna suficiente?
- ¿La población estudiada se parece a la de mi paciente?
- ¿Los desenlaces son clínicamente relevantes?
Paso 2. Contextualizar al sistema de salud
- Disponibilidad del medicamento o intervención.
- Costo y cobertura (SIS, EsSalud, seguros privados).
- Acceso a seguimiento y monitorización.
Paso 3. Evaluar beneficio neto
- Medidas absolutas: ARR, NNT, NNH.
- Evaluar balance beneficio-riesgo-costo.
Paso 4. Decisión compartida
- Explicar resultados en lenguaje sencillo.
- Respetar valores y prioridades del paciente (ej. supervivencia vs. calidad de vida).
2. Herramientas para la traslación
- Guías de práctica clínica (GPC): resumen la mejor evidencia y adaptan recomendaciones.
- Adaptaciones locales: ej. guías peruanas de hipertensión, diabetes, COVID-19.
- Calculadoras clínicas: MDCalc, UpToDate, QxMD, que transforman ensayos en indicadores prácticos (ej. riesgo cardiovascular, NNT).
- Listas de chequeo de aplicabilidad: preguntas rápidas:
- ¿Mi paciente se parece a los del ensayo?
- ¿El tratamiento está disponible aquí?
- ¿El beneficio es mayor que el riesgo?
- ¿El paciente lo acepta?
3. Ejemplos clínicos
Cardiología: Insuficiencia cardíaca
- Evidencia: DAPA-HF mostró que dapagliflozina reduce mortalidad CV y hospitalizaciones (NNT≈21 en 18 meses).
- Traslación en Perú:
- En un paciente con SIS, puede que no esté disponible → se priorizan IECA, betabloqueadores y espironolactona.
- En pacientes con acceso privado, se puede incorporar siguiendo las guías ESC/AHA.
Endocrinología: Diabetes tipo 2
- Evidencia: EMPA-REG OUTCOME: empagliflozina reduce mortalidad CV.
- Traslación local:
- Disponible en farmacias privadas, pero costo alto.
- En contextos de bajos recursos, se prioriza metformina + sulfonilureas, y se reserva iSGLT2 para casos seleccionados.
Infectología: VIH
- Evidencia: ensayos en África y Europa muestran eficacia del TAR combinado.
- Traslación en Perú: depende de disponibilidad en el programa nacional, adherencia y soporte comunitario.
4. Limitaciones y desafíos
- Multimorbilidad: muchos pacientes no se parecen a los del ensayo, que suelen ser más “puros”.
- Polifarmacia: interacciones no evaluadas en los RCTs.
- Factores sociales: pobreza, acceso limitado a fármacos, dificultades de adherencia.
- Exclusiones sistemáticas: ancianos, embarazadas, pacientes con ERC avanzada → población real subrepresentada.
5. Ejemplo aplicado paso a paso (caso práctico)
Paciente de 72 años, con IC con fracción reducida, diabetes y cobertura SIS.
- Evidencia disponible: dapagliflozina reduce mortalidad y hospitalizaciones (DAPA-HF).
- Juicio clínico: paciente frágil, polifarmacia, requiere priorizar costo-efectividad.
- Contexto local: dapagliflozina no está cubierta por SIS.
- Decisión compartida: se optimiza tratamiento con IECA, betabloqueadores, antagonistas de mineralocorticoides, y se explica al paciente que existen opciones más nuevas, pero de costo inaccesible actualmente.
👉 Conclusión: la traslación no es solo “seguir guías internacionales”, sino adaptar a la realidad del paciente y del sistema.
5.4. LIMITACIONES Y GENERALIZACIÓN A DISTINTOS CONTEXTOS
Introducción
Los ensayos clínicos aleatorizados (ECA) son considerados el estándar de oro en investigación clínica por su alta validez interna. Sin embargo, que un ensayo sea “válido” dentro de su diseño no significa automáticamente que sus hallazgos puedan aplicarse de manera generalizada.
- La validez interna asegura que los resultados sean confiables dentro del ensayo.
- La validez externa o generalización determina hasta qué punto esos resultados se pueden extrapolar a otros pacientes, entornos sanitarios o poblaciones.
👉 El gran desafío para el médico clínico es decidir cuándo y cómo aplicar la evidencia global a la práctica local.
1. Factores que limitan la generalización
1.1. Selección de la población en los ensayos
- Los ECA suelen incluir pacientes muy seleccionados: edad media, pocas comorbilidades, alta adherencia.
- En la práctica, nuestros pacientes son más heterogéneos: adultos mayores, multimórbidos, con polifarmacia y baja adherencia.
Ejemplo:
- Ensayos de estatinas en prevención primaria reclutan personas de 40–65 años sin enfermedades graves.
- En Perú, muchos pacientes llegan a consulta con diabetes, hipertensión y obesidad simultáneas. La aplicabilidad es limitada.
1.2. Exclusiones sistemáticas
Muchos ensayos excluyen:
- Ancianos >75–80 años.
- Mujeres embarazadas.
- Pacientes con insuficiencia renal avanzada.
- Pacientes con cáncer o enfermedades crónicas severas.
👉 Esto genera un sesgo: los grupos más vulnerables en la práctica clínica no están representados en la evidencia.
1.3. Diferencias en los sistemas de salud
Los recursos disponibles para implementar una intervención varían enormemente.
- En países de ingresos altos, los pacientes tienen acceso a fármacos de última generación, monitoreo continuo, terapias avanzadas.
- En países como Perú, muchos hospitales enfrentan desabastecimiento, limitaciones de laboratorio y falta de acceso a UCI.
Ejemplo:
- Ensayos de manejo avanzado de sepsis incluyen UCI con monitoreo invasivo y protocolos de fluidos guiados.
- En un hospital II-2 de la Amazonía peruana, con acceso restringido a vasopresores y sin monitoreo hemodinámico, los mismos resultados no son replicables.
1.4. Factores socioeconómicos y culturales
- Costo y acceso: un tratamiento efectivo en EE. UU. puede ser inaccesible en Perú por precio o falta de cobertura en el SIS/EsSalud.
- Adherencia: la precariedad económica y las creencias culturales pueden reducir la eficacia en la práctica.
- Educación del paciente: la capacidad de comprender riesgos y beneficios influye en la implementación.
Ejemplo:
- Ensayos en diabetes muestran adherencia >90% a terapias.
- En Perú, los pacientes interrumpen tratamiento por desabastecimiento o costo → la eficacia real es menor.
1.5. Diferencias epidemiológicas
La carga de enfermedad varía entre regiones.
- Enfermedades crónicas en países desarrollados vs. coexistencia de enfermedades infecciosas en América Latina.
- Esto puede modificar la respuesta a terapias.
Ejemplo:
- Ensayos de VIH en Europa vs. pacientes en la selva peruana, donde la coinfección con TB o parásitos altera el curso clínico y la aplicabilidad de resultados.
2. Estrategias para mejorar la generalización
- Revisar análisis de subgrupos en los ensayos: mujeres, ancianos, diabéticos, etc.
- Complementar con estudios pragmáticos: reflejan mejor la práctica real que los ensayos explicativos.
- Apoyarse en registros y cohortes locales: validan si la intervención es útil en poblaciones latinoamericanas.
- Usar guías adaptadas regionalmente: como las recomendaciones de sociedades latinoamericanas que contextualizan costo y acceso.
- Modelos de implementación progresiva: introducir terapias en fases piloto antes de generalizarlas.
3. Ejemplos de limitaciones en la práctica
Cardiología
- TAVI (implante valvular aórtico transcatéter): probado en Europa/EE. UU. con centros de alto volumen.
- En Perú, solo disponible en hospitales privados de Lima → aplicabilidad nacional limitada.
Endocrinología
- Tirzepatida (ensayos SURMOUNT/SURPASS): mostró pérdida de peso y control glucémico espectaculares.
- En Perú, su costo y limitada disponibilidad hacen que la generalización a la población pública sea casi imposible.
Nefrología
- Guías KDIGO: recomiendan inhibidores SGLT2 para enfermedad renal crónica.
- Limitación: en hospitales públicos, la terapia estándar sigue siendo IECA/ARA-II por costo y acceso.
4. Implicancias prácticas
Antes de aplicar la evidencia, el médico debe preguntarse:
- ¿Mi paciente se parece a los incluidos en el ensayo?
- Edad, comorbilidades, adherencia.
- ¿Mi hospital/sistema de salud puede replicar el contexto del ensayo?
- Acceso a fármacos, infraestructura, seguimiento.
- ¿El beneficio esperado justifica los costos y riesgos en este entorno?
- Balance riesgo-beneficio-costo.
Descubre más desde Medicina Cardiometabólica
Suscríbete y recibe las últimas entradas en tu correo electrónico.