Comparación del efecto antihipertensivo de enalapril versus captopril sobre la reducción de presión arterial sistólica: análisis multivariado mediante regresión lineal y logística en Stata

Introducción

La hipertensión arterial (HTA) constituye uno de los principales factores de riesgo cardiovascular a nivel mundial y se asocia con incremento de eventos cardiovasculares, enfermedad renal crónica, insuficiencia cardíaca y mortalidad prematura. La reducción de la presión arterial sistólica (PAS) mediante tratamiento farmacológico disminuye significativamente el riesgo de complicaciones cardiovasculares mayores.

Los inhibidores de la enzima convertidora de angiotensina (IECA), como enalapril y captopril, son medicamentos ampliamente utilizados en el manejo de la HTA. Aunque ambos pertenecen al mismo grupo farmacológico, presentan diferencias farmacocinéticas y farmacodinámicas que podrían influir en la magnitud de reducción de la presión arterial, la adherencia terapéutica y la aparición de efectos adversos.

En estudios clínicos observacionales y experimentales, la respuesta antihipertensiva puede estar influenciada por múltiples variables confusoras e intervinientes, tales como edad, obesidad, diabetes mellitus, enfermedad renal crónica, adherencia terapéutica, ingesta de sodio, severidad basal de la hipertensión y uso previo de antihipertensivos. Por ello, el análisis multivariado permite estimar el efecto independiente del tratamiento ajustando simultáneamente por dichas variables.

La presente práctica tiene como finalidad aplicar modelos de regresión multivariada en Stata utilizando una base simulada clínicamente plausible para evaluar el efecto de enalapril versus captopril sobre la reducción de la presión arterial sistólica.


Objetivo general

Evaluar la asociación entre el uso de enalapril versus captopril y la reducción de la presión arterial sistólica mediante análisis multivariado.


Objetivos específicos

  1. Comparar la reducción media de la presión arterial sistólica entre pacientes tratados con enalapril y captopril.
  2. Evaluar la asociación ajustada entre tipo de tratamiento y control de presión arterial.
  3. Identificar variables confusoras asociadas a menor respuesta antihipertensiva.
  4. Explorar interacciones entre tratamiento y variables clínicas como obesidad o diabetes mellitus.
  5. Construir modelos de regresión lineal y logística para estimar efectos ajustados.

Hipótesis

Hipótesis nula (H0)

No existen diferencias significativas en la reducción de presión arterial sistólica entre pacientes tratados con enalapril y aquellos tratados con captopril, luego de ajustar por variables confusoras.

Hipótesis alterna (H1)

Los pacientes tratados con enalapril presentan una mayor reducción de presión arterial sistólica comparados con aquellos tratados con captopril, luego de ajustar por variables confusoras.


Diccionario de variables

VariableTipoCodificaciónRol
idNuméricaIdentificador únicoIdentificación
tratamientoBinaria1=Enalapril, 0=CaptoprilIndependiente principal
tratamiento_txtStringNombre del fármacoDescriptiva
edadContinuaAñosConfusora
sexoBinaria1=Masculino, 0=FemeninoConfusora
sexo_txtStringMasculino/FemeninoDescriptiva
imcContinuakg/m²Confusora
obesidadBinaria1=IMC ≥30Confusora
pas_baselineContinuammHgConfusora
pad_baselineContinuammHgConfusora
pas_finalContinuammHgDependiente
pad_finalContinuammHgDependiente
delta_pasContinuaPAS basal − PAS finalDependiente principal
control_pasBinaria1=PAS <140 mmHgDependiente
adherencia_pctContinua% adherenciaInterviniente
adherencia_altaBinaria1=≥80%Interviniente
dosis_mg_diaContinuamg/díaConfusora
sodio_g_diaContinuagramos/díaConfusora
actividad_min_semContinuaminutos/semanaConfusora
tabaquismoBinaria1=SíConfusora
diabetesBinaria1=SíConfusora
ercBinaria1=Enfermedad renal crónicaConfusora
dislipidemiaBinaria1=SíConfusora
duracion_htaContinuaaños desde diagnósticoConfusora
antihip_prevBinaria1=Uso previo antihipertensivoConfusora
riesgo_cv_altoBinaria1=Alto riesgo cardiovascularConfusora
efecto_advBinaria1=Presentó evento adversoDependiente secundaria
visitas_controlDiscretaNúmero de visitasInterviniente
hospitalCategóricaHospital A/B/CEfecto de cluster
medicoCategóricaM1–M6Efecto de cluster
severidad_htaBinaria1=HTA severaConfusora
interaccion_tx_obesidadBinaria1=Tratamiento × obesidadInteracción

Paso 1. Verificación de variables y conversión de variables string

Objetivo

Identificar el tipo de variables presentes en la base de datos y convertir variables categóricas tipo string a formato numérico etiquetado para poder utilizarlas en análisis multivariado en Stata.


1. Abrir la base de datos

import excel "enalapril_captopril_multivariado_stata.xlsx", firstrow clear

2. Verificar estructura de variables

describe

Permite identificar:

  • Variables numéricas
  • Variables string
  • Tipo de almacenamiento
  • Etiquetas
  • Número de observaciones

3. Inspeccionar algunas observaciones

list in 1/10

4. Identificar variables string

describe, short
describe

Las variables string aparecerán como:

  • str8
  • str10
  • str15
    etc.

En esta base:

  • hospital
  • medico
  • tratamiento_txt
  • sexo_txt

son variables string.


5. Convertir variables string categóricas a numéricas etiquetadas

Hospital

encode hospital, gen(hospital_id)

Médico

encode medico, gen(medico_id)

6. Verificar conversión

describe hospital*
describe medico*

7. Ver etiquetas creadas automáticamente

label list

9. Comprobar frecuencia de categorías

Hospital

tab hospital_id

Médico

tab medico_id

10. Verificar valores perdidos

misstable summarize

Interpretación esperada

  • Las variables categóricas ahora serán utilizables en:
    • regresión lineal
    • regresión logística
    • modelos multinivel
    • análisis de interacción

Ejemplo:

regress delta_pas i.hospital i.medico edad imc tratamiento

El prefijo i. indica a Stata que la variable es categórica.

Paso 2. Evaluación previa al modelo

Objetivo

Evaluar los supuestos iniciales antes de construir modelos multivariados:

  • distribución de variables continuas,
  • normalidad,
  • presencia de outliers,
  • asimetría,
  • curtosis,
  • variabilidad entre grupos.

Estas evaluaciones son importantes porque varios modelos paramétricos asumen:

  • distribución aproximadamente normal de residuos,
  • ausencia de valores extremos severos,
  • relación lineal entre variables.

Variable principal de interés

Trabajaremos principalmente con:

delta_pas

(Disminución de presión arterial sistólica)


1. Histograma con curva normal

Sintaxis

histogram delta_pas, normal

Objetivo

Evaluar visualmente:

  • simetría,
  • dispersión,
  • forma de distribución,
  • aproximación a normalidad.

Interpretación

Compatible con normalidad:

  • forma de campana,
  • distribución simétrica,
  • curva normal superpuesta similar al histograma.

Sugiere no normalidad:

  • cola derecha o izquierda marcada,
  • múltiples picos,
  • fuerte asimetría.

2. Q-Q plot (normalidad gráfica)

Sintaxis

qnorm delta_pas

Objetivo

Comparar cuantiles observados vs cuantiles teóricos normales.

Interpretación

Normalidad aproximada:

  • puntos cercanos a la línea diagonal.

No normalidad:

  • desviaciones importantes,
  • curvaturas,
  • colas alejadas.

3. Prueba de Shapiro-Wilk

Sintaxis

swilk delta_pas

Hipótesis

H0:

La variable sigue distribución normal.

H1:

La variable NO sigue distribución normal.


Interpretación

p valorInterpretación
p > 0.05Compatible con normalidad
p < 0.05Evidencia contra normalidad

4. Asimetría y curtosis

Sintaxis

sktest delta_pas
summarize delta_pas, detail
Complementar con:
histogram delta_pas, normal
qnorm delta_pas
kdensity delta_pas
graph box delta_pas

Evalúa

  • skewness (asimetría),
  • kurtosis (curtosis),
  • prueba global de normalidad.

Interpretación

p valorInterpretación
p > 0.05Compatible con normalidad
p < 0.05Evidencia contra normalidad

Asimetría

  • positiva → cola derecha,
  • negativa → cola izquierda.

Curtosis

  • leptocúrtica → colas pesadas,
  • platicúrtica → distribución achatada.

5. Detección de outliers mediante boxplot

Comparar por tratamiento

graph box delta_pas, over(tratamiento)

Crear etiquetas:
label define trat_lbl 0 "Captopril" 1 "Enalapril"
label values tratamiento trat_lbl
graph box delta_pas, over(tratamiento)


Interpretación

El boxplot permite visualizar:

  • mediana,
  • rango intercuartílico,
  • dispersión,
  • valores extremos.

Posibles hallazgos

HallazgoInterpretación
Mayor reducción en EnalaprilPosible efecto terapéutico
Muchos outliersRevisar calidad de datos
Distribución muy asimétricaConsiderar transformación
Gran dispersiónAlta variabilidad clínica

Evaluación de otras variables continuas

Edad

histogram edad, normal
qnorm edad
swilk edad

IMC

histogram imc, normal
qnorm imc
swilk imc

PAS basal

histogram pas_baseline, normal
qnorm pas_baseline
swilk pas_baseline

Paso 3. Correlación y colinealidad

Paso 3. Correlación y colinealidad

Objetivo

Evaluar:

  • asociación entre variables continuas,
  • posible multicolinealidad,
  • redundancia entre predictores,
  • estabilidad futura del modelo multivariado.

La multicolinealidad puede:

  • inflar errores estándar,
  • volver inestables los coeficientes,
  • alterar significancia estadística,
  • dificultar interpretación clínica.

1. Correlación de Pearson

Variables continuas principales

pwcorr delta_pas edad imc pas_baseline pad_baseline sodio_g_dia actividad_min_sem, sig

¿Qué evalúa?

  • Dirección de asociación.
  • Magnitud de correlación.
  • Significancia estadística.

Interpretación del coeficiente r

rInterpretación
0.00–0.19Muy débil
0.20–0.39Débil
0.40–0.59Moderada
0.60–0.79Fuerte
≥0.80Muy fuerte

2. Correlación no paramétrica (Spearman)

spearman delta_pas adherencia_pct dosis_mg_dia duracion_hta_anios

Útil si:

  • hay asimetría,
  • outliers,
  • relaciones monotónicas no lineales.
spearman delta_pas edad imc pas_baseline adherencia_pct

3. Construcción preliminar del modelo

Antes de evaluar colinealidad:

regress delta_pas i.tratamiento edad i.sexo imc pas_baseline i.diabete

¿Por qué NO meter todo?

Porque puedes introducir:

  • sobreajuste,
  • colinealidad,
  • mediadores,
  • variables post-basales.

¿Por que no incluir adherencia al modelo?
Por que es Mediador

Es decir:

tratamiento → adherencia → reducción PAS

Por ejemplo:

  • Enalapril puede generar mejor adherencia
  • mejor adherencia produce mayor reducción de PAS

Entonces, si ajustas por adherencia:

tratamiento → adherencia → delta_pas
ajustas aquí

puedes eliminar parte del efecto verdadero del tratamiento.


4. Evaluación de multicolinealidad

Variance Inflation Factor (VIF)

vif

o:

estat vif

Interpretación de VIF

vif

VIFInterpretación
1Sin colinealidad
1–5Aceptable
>5Colinealidad moderada
>10Colinealidad severa

Interpretación esperada

Variables evaluadas en el modelo

VariablesResultado observadoInterpretación
tratamiento ↔ edadVIF bajoSin colinealidad relevante
tratamiento ↔ diabetesVIF bajoVariables independientes
edad ↔ IMCVIF bajoAsociación mínima
IMC ↔ PAS basalVIF bajoSin redundancia importante
PAS basal ↔ diabetesVIF bajoCorrelación clínica leve, sin impacto en modelo
todas las variablesMean VIF = 1.06Modelo estable

5. Identificar redundancia conceptual

Aunque estadísticamente NO existe multicolinealidad significativa, sí deben considerarse algunas relaciones conceptuales entre variables.

Ejemplos clínicos potenciales

VariablesRelación conceptual
IMC ↔ obesidadObesidad deriva del IMC
PAS basal ↔ severidad HTASeveridad definida por PAS
edad ↔ duración HTARelación temporal esperable
diabetes ↔ riesgo CV altoRiesgo estructural compartido

Paso 4. Regresión lineal múltiple

Objetivo

Evaluar el efecto independiente de:

  • Enalapril vs Captopril

sobre:

  • reducción de presión arterial sistólica (delta_pas),

ajustando por:

  • edad,
  • sexo,
  • IMC,
  • PAS basal,
  • adherencia,
  • diabetes,
  • ERC,
  • sodio,
  • actividad física,
  • duración de HTA.

Diferencia entre regresión simple y múltiple

CaracterísticaSimpleMúltiple
Nº predictores1≥2
Ajuste por confusiónNo
Realismo clínicoMenorMayor
Riesgo de sesgoAltoMenor
InterpretaciónCrudaAjustada

Variable dependiente

delta_pas

(Variable continua)


Modelo inicial

Modelo parsimonioso preliminar

regress delta_pas i.tratamiento edad i.sexo imc pas_baseline i.diabetes
regress delta_pas ib1.tratamiento edad i.sexo imc pas_baseline i.diabetes
regress delta_pas ib0.tratamiento edad i.sexo imc pas_baseline i.diabetes
ib significa indicador base
SintaxisSignificadoReferencia
i.tratamientocategórica automáticamenor valor
ib0.tratamientobase explícita0
ib1.tratamientobase explícita1

¿Qué hace este modelo?

Estima el cambio promedio en:

reducción de PAS

asociado a cada predictor,
manteniendo constantes las demás variables.


Resultados obtenidos

VariableβpIC95%Interpretación
Enalapril+7.23<0.0014.95 a 9.51Mayor reducción de PAS
Edad+0.0380.483-0.068 a 0.144No significativo
Sexo masculino+0.6050.599-1.66 a 2.87No significativo
IMC+0.1250.337-0.131 a 0.381No significativo
PAS basal-0.0590.266-0.163 a 0.045No significativo
Diabetes-4.59<0.001-7.14 a -2.04Menor reducción de PAS

Enalapril produce una reducción promedio de PAS aproximadamente 7.23 mmHg mayor que Captopril, ajustando por edad, sexo, IMC, PAS basal y diabetes.

regress delta_pas ib1.tratamiento edad i.sexo imc pas_baseline i.diabetes
Captopril produce una reducción promedio de PAS aproximadamente 7.23 mmHg menor que Enalapril, ajustando por edad, sexo, IMC, PAS basal y diabetes.


Interpretación clínica principal

Tratamiento

β = +7.23 mmHgp < 0.001

Interpretación:

  • Los pacientes tratados con Enalapril presentaron una reducción promedio adicional de 7.23 mmHg respecto a Captopril,
  • luego de ajustar por edad, sexo, IMC, PAS basal y diabetes.

Importancia clínica

Una reducción de:

  • 5–10 mmHg de PAS

puede asociarse con:

  • disminución de ACV,
  • reducción de eventos cardiovasculares,
  • menor progresión renal,
  • reducción de mortalidad cardiovascular.

Diabetes mellitus

β = -4.59 mmHgp < 0.001

Interpretación:

  • Los pacientes diabéticos tuvieron menor respuesta antihipertensiva.

Posibles mecanismos

  • rigidez arterial,
  • disfunción endotelial,
  • hiperactividad simpática,
  • nefropatía diabética,
  • mayor resistencia vascular.

Interpretación según tipo de variable

TipoInterpretación
ContinuaCambio por unidad
BinariaDiferencia promedio entre grupos
CategóricaComparación respecto referencia

Variables del modelo ampliado teórico

VariableTipoRol
tratamientoBinariaPrincipal exposición
edadContinuaConfusora
sexoBinariaConfusora
imcContinuaConfusora
pas_baselineContinuaSeveridad basal
adherencia_pctContinuaInterviniente
sodio_g_diaContinuaFactor dietético
actividad_min_semContinuaEstilo de vida
diabetesBinariaComorbilidad
ercBinariaComorbilidad
duracion_htaContinuaCrónicaidad

Bondad de ajuste

ParámetroResultado
n180
F global10.09
p global<0.001
0.259
R² ajustado0.234

Interpretación del R²

R² = 0.259

El modelo explica aproximadamente:

  • 25.9% de la variabilidad de delta_pas.

Interpretación epidemiológica

En estudios clínicos:

  • R² moderados son frecuentes,
  • gran parte de la respuesta antihipertensiva depende de:
    • genética,
    • adherencia real,
    • dieta,
    • variabilidad biológica,
    • factores no medidos.

Resultados importantes a revisar


1. Coeficientes β

Evalúan:

  • magnitud,
  • dirección del efecto.

2. p valor

p < 0.05

→ asociación estadísticamente significativa.


3. Intervalos de confianza

Stata los muestra automáticamente:

regress delta_pas i.tratamiento edad i.sexo imc pas_baseline i.diabetes

4. Prueba F global

Evalúa:

H0

Todos los coeficientes = 0.

Resultado:

Prob > F = 0.0000

Interpretación:

  • el modelo globalmente es significativo.

¿Por qué NO meter todas las variables?

Porque puedes introducir:

ProblemaConsecuencia
SobreajusteModelo inestable
ColinealidadIC amplios
MediadoresSobreajuste causal
Variables post-basalesSesgo
RedundanciaMenor interpretabilidad

Variables NO normales encontradas

VariableNormalidad
adherencia_pctNo normal
dosis_mg_diaNo normal
duracion_htaNo normal

Importante conceptualmente

En regresión lineal:

  • NO es obligatorio que los predictores sean normales.

Lo importante es:

  • normalidad de residuos,
  • homocedasticidad,
  • linealidad.

Modelo ampliado recomendado

Versión ajustada robusta

regress delta_pas i.tratamiento edad i.sexo imc pas_baseline adherencia_pct sodio_g_dia actividad_min_sem i.diabetes i.erc duracion_hta, robust

¿Por qué usar robust?

Porque:

  • protege frente a heterocedasticidad,
  • produce errores estándar más confiables,
  • es estándar en epidemiología clínica moderna.

Los resultados robus mostrarán:

  • el uso de enalapril se asoció significativamente con mayor reducción de presión arterial sistólica,
  • mientras que la diabetes mellitus se asoció con menor respuesta antihipertensiva,
  • independientemente de variables demográficas y clínicas incluidas en el análisis.

Modelo con factor variables correctamente especificadas

regress delta_pas i.tratamiento i.sexo c.edad c.imc c.pas_baseline c.adherencia_pct c.sodio_g_dia c.actividad_min_sem i.diabetes i.erc c.duracion_hta, robust

Diferencia importante: c. vs i.

PrefijoSignificadoTipo de variable
c.ContinuousContinua
i.IndicatorCategórica/binaria
##Interacción completaInteracción
#Solo interacciónInteracción simple

Interpretación clínica esperada

VariableEfecto esperado
EnalaprilMayor reducción
PAS basal altaMayor descenso
Mejor adherenciaMejor respuesta
Alto sodioMenor respuesta
Diabetes/ERCMenor control

Diagnóstico posterior del modelo


1. Multicolinealidad

vif

2. Residuos

predict resid, residuals

3. Normalidad de residuos

histogram resid, normal
qnorm resid
swilk resid

4. Homocedasticidad

rvfplot
estat hettest
p = 0.7913
No existe evidencia estadísticamente significativa de heterocedasticidad.
El modelo cumple adecuadamente el supuesto de: varianza constante de residuos.

Paso 5. Regresión logística multivariada

Objetivo

Evaluar factores asociados al:

control de presión arterial

mediante:

  • regresión logística multivariada,
  • estimación de Odds Ratios (OR) ajustados.

Variable dependiente

Control de PAS

tab control_pas

Codificación:

ValorInterpretación
1PAS controlada (<140 mmHg)
0PAS no controlada

¿Por qué usar regresión logística?

Porque el desenlace es:

  • binario,
  • dicotómico,
  • sí/no.

La regresión logística permite:

  • estimar probabilidades,
  • calcular OR ajustados,
  • controlar confusión.

Modelo logístico inicial

Comando

logistic control_pas i.tratamiento i.sexo c.edad c.imc c.pas_baseline c.sodio_g_dia i.diabetes i.erc

Diferencia entre logistic y logit

ComandoResultado
logisticOR directamente
logitcoeficientes logit

Modelo ampliado

logistic control_pas i.tratamiento i.sexo c.edad c.imc c.pas_baseline c.adherencia_pct c.sodio_g_dia c.actividad_min_sem i.diabetes i.erc c.duracion_hta_anios

Interpretación de Odds Ratio (OR)

ORInterpretación
OR = 1Sin asociación
OR >1Mayor odds del evento
OR <1Menor odds del evento

Ejemplo de interpretación

Tratamiento

VariableORIC95%p
Enalapril2.81.5–5.20.001

Interpretación:

Los pacientes tratados con enalapril presentan:

2.8 veces mayores odds

de lograr control de PAS comparados con captopril.


Variables continuas

Ejemplo

VariableOR
sodio_g_dia0.82

Interpretación:

Cada incremento de:

  • 1 g/día de sodio

se asocia con:

  • 18% menor odds de control de PAS.

Bondad de ajuste

Clasificación

estat classification

Permite evaluar:

  • sensibilidad,
  • especificidad,
  • porcentaje correctamente clasificado.

Hosmer-Lemeshow

estat gof

Hipótesis

H0:

Buen ajuste del modelo.

Interpretación

p valorInterpretación
p >0.05Buen ajuste
p <0.05Mal ajuste

El resultado mostrara que No se encontró evidencia de mal ajuste del modelo p > 0.05


Curva ROC

Comando

lroc

Interpretación del AUC

AUCInterpretación
0.5Sin discriminación
0.6–0.7Pobre
0.7–0.8Aceptable
0.8–0.9Excelente
>0.9Sobresaliente

Probabilidades predichas

Generar probabilidades

predict p_control

Visualizar probabilidades

summarize p_control

Interacciones

Tratamiento × diabetes

logistic control_pas i.tratamiento##i.diabetes c.edad c.imc
  • Los pacientes tratados con enalapril tuvieron aproximadamente 2 veces más odds de lograr control de presión arterial comparados con captopril, aunque sin significancia estadística completa.
  • Los pacientes con diabetes mellitus tuvieron aproximadamente 4.5 veces menos odds de lograr control de presión arterial comparados con no diabéticos.
  • La interacción tratamiento × diabetes no fue significativa, sugiriendo que el efecto de enalapril fue relativamente similar en diabéticos y no diabéticos.
  • Por cada año adicional de edad, las odds de control de presión arterial disminuyeron aproximadamente 4.7%.
  • El IMC no mostró asociación significativa con el control de presión arterial en el modelo ajustado.

Paso 6. Regresión de Poisson / Riesgos relativos (RR)

Objetivo

Evaluar factores asociados al control de presión arterial sistólica mediante:

  • regresión de Poisson,
  • estimación de Riesgos Relativos (RR) ajustados.
OutcomeModeloMedida
continuolinealβ
binariologísticaOR
binario frecuentePoisson robustaRR
conteoPoissonIRR
conteo sobredispersobinomial negativaIRR
ordinalordinalOR
nominal >2multinomialRRR
tiempo-eventoCoxHR
longitudinalGEE/mixtosdepende

Modelo de Poisson robusto

poisson control_pas i.tratamiento i.sexo c.edad c.imc c.pas_baseline c.adherencia_pct c.sodio_g_dia c.actividad_min_sem i.diabetes i.erc c.duracion_hta_anios, robust irr

¿Qué significa irr?

Incidence Rate Ratio

En desenlaces binarios:

  • se interpreta aproximadamente como Riesgo Relativo (RR).

Interpretación de RR

RRInterpretación
RR = 1Sin asociación
RR >1Mayor probabilidad
RR <1Menor probabilidad

Ejemplos de interpretación

RR = 1.5

1.5 veces más probabilidad

de lograr control de PAS.


RR = 0.70

30% menos probabilidad

de lograr control de PAS.


Bondad del modelo

Pseudo log likelihood

El modelo utiliza:

  • estimación robusta,
  • adecuada para datos binarios frecuentes.

Comparación con regresión logística

ModeloMedida
LogisticOdds Ratio (OR)
Poisson robustoRiesgo Relativo (RR)

Ventaja clínica del RR

El RR es:

  • más intuitivo,
  • más interpretable clínicamente,
  • menos propenso a sobreestimar efectos cuando el evento es frecuente.

Posible interacción

Tratamiento × diabetes

poisson control_pas i.tratamiento##i.diabetes c.edad c.imc, robust irr

Interpretación clínica

Permite evaluar si:

  • el efecto de enalapril cambia según presencia de diabetes mellitus.

Interpretación esperada del modelo

  • RR >1:
    • mayor probabilidad de control de PAS.
  • RR <1:
    • menor probabilidad de control de PAS.
  • Variables significativas:
    • asociaciones independientes ajustadas.

Paso 7. Regresión binomial negativa

Objetivo

Evaluar variables asociadas a un desenlace de conteo utilizando:

  • regresión binomial negativa,
  • especialmente cuando existe:
    • sobredispersión,
    • varianza mayor que la media.

¿Cuándo usar regresión binomial negativa?

Se utiliza cuando:

  • la variable dependiente es de conteo,
  • existen muchos valores dispersos,
  • Poisson no ajusta adecuadamente.

Variable dependiente de conteo

En esta base utilizaremos:

visitas_control

Número de visitas de control realizadas por el paciente.


Verificar distribución

summarize visitas_control, detailtab visitas_control

Evaluar media vs varianza

Concepto importante

Poisson asume:

Var(Y)=E(Y)Var(Y)=E(Y)Var(Y)=E(Y)


Sobredispersión

Si:

Var(Y)>E(Y)Var(Y)>E(Y)Var(Y)>E(Y)

→ existe sobredispersión.

En ese caso:

  • Poisson puede subestimar errores estándar,
  • binomial negativa suele ser mejor opción.

Modelo Poisson inicial

poisson visitas_control i.tratamiento i.diabetes c.edad c.imc

Modelo binomial negativo

nbreg visitas_control i.tratamiento i.diabetes c.edad c.imc

Mostrar IRR

nbreg visitas_control i.tratamiento i.diabetes c.edad c.imc, irr

¿Qué significa IRR?

Incidence Rate Ratio

Interpretación similar a RR para variables de conteo.


Interpretación de IRR

IRRInterpretación
IRR = 1Sin asociación
IRR >1Más eventos
IRR <1Menos eventos

Ejemplo clínico

IRR = 1.40

Interpretación:

Los pacientes tratados con enalapril tuvieron:

1.4 veces más visitas de control

comparados con captopril.


Ejemplo IRR <1

IRR = 0.70

Interpretación:

Los pacientes diabéticos tuvieron:

30% menos visitas

comparados con no diabéticos.


Evaluar sobredispersión

Comparar Poisson vs binomial negativa

estat ic

Interpretación

Menor:

  • AIC,
  • BIC

→ mejor ajuste.


Parámetro alfa

La binomial negativa estima:

alpha

Interpretación

ResultadoInterpretación
alpha ≈ 0Poisson suficiente
alpha >0 significativoExiste sobredispersión

Modelo ampliado

nbreg visitas_control i.tratamiento i.sexo c.edad c.imc c.pas_baseline c.adherencia_pct c.sodio_g_dia i.diabetes i.erc c.duracion_hta_anios, irr

Interacciones

Tratamiento × diabetes

nbreg visitas_control i.tratamiento##i.diabetes c.edad c.imc, irr

Diferencia entre modelos

ModeloOutcome
Regresión linealContinua
LogisticBinaria
PoissonConteo
Binomial negativaConteo con sobredispersión

Paso 8. Análisis de supervivencia

Objetivo

Evaluar el tiempo hasta la ocurrencia de un evento mediante:

  • curvas de Kaplan-Meier,
  • prueba de Log-rank,
  • regresión de Cox multivariada.

¿Qué analiza supervivencia?

No solo evalúa:

  • si ocurre un evento,

sino también:

  • cuándo ocurre.

Variables necesarias

Tiempo

duracion_hta_anios

(simulación de tiempo de seguimiento)


Evento

Usaremos:

control_pas

Interpretación:

ValorSignificado
1Evento ocurrió
0Censurado

1. Declarar datos de supervivencia

Comando

stset duracion_hta_anios, failure(control_pas==1)

Interpretación

Stata ahora reconoce:

  • variable tiempo,
  • variable evento,
  • censura.

2. Curva de Kaplan-Meier

Curva global

sts graph

Kaplan-Meier por tratamiento

sts graph, by(tratamiento)

Interpretación

La curva muestra:

  • probabilidad acumulada de permanecer sin evento a lo largo del tiempo.

Interpretación clínica

Separación de curvas:

  • sugiere diferencias entre tratamientos.

3. Prueba de Log-rank

Comando

sts test tratamiento

Hipótesis

H0:

No diferencias entre curvas.

H1:

Las curvas son diferentes.


Interpretación

p valorInterpretación
p <0.05Diferencia significativa
p >0.05No diferencia

La prueba de Log-rank mostró diferencias estadísticamente significativas entre las curvas de supervivencia de:

  • enalapril,
  • captopril.

4. Modelo de Cox multivariado

Comando

stcox i.tratamiento i.sexo c.edad c.imc i.diabetes i.erc
  • El modelo de Cox fue globalmente significativo:
p = 0.0085

lo que indica que las variables incluidas se asocian significativamente con el tiempo hasta lograr control de presión arterial.


Interpretación del HR

HRInterpretación
HR = 1Sin asociación
HR >1Mayor riesgo del evento
HR <1Menor riesgo
  • Los pacientes tratados con enalapril tuvieron aproximadamente:
1.95 veces mayor probabilidad instantánea

de lograr control de presión arterial comparados con captopril.

HR = 1.95 ; p = 0.018

  • La diabetes mostró tendencia a menor probabilidad de control tensional:
HR = 0.54

aproximadamente:

  • 46% menor probabilidad instantánea,
    aunque sin significancia estadística completa.

  • Sexo, edad, IMC y enfermedad renal crónica no mostraron asociación significativa con el tiempo hasta el control de PAS en este modelo ajustado.

5. Verificar proporcionalidad de riesgos

Comando

estat phtest

Hipótesis

H0:

Se cumple proporcionalidad de riesgos.


Interpretación

p valorInterpretación
p >0.05Supuesto cumplido
p <0.05Violación del supuesto
  • La prueba de proporcionalidad de riesgos no mostró evidencia de violación del supuesto de hazards proporcionales.
p = 0.8273

  • El supuesto fundamental del modelo de Cox se considera cumplido:
p > 0.05

  • Esto indica que los Hazard Ratios (HR) pueden interpretarse como relativamente constantes a lo largo del tiempo de seguimiento.

  • Por tanto, el modelo de Cox presenta adecuada validez metodológica para interpretar asociaciones temporales en esta cohorte simulada.

Curvas ajustadas

Supervivencia ajustada por tratamiento

stcurve, survival at1(tratamiento=0) at2(tratamiento=1)

Conceptos importantes

ConceptoSignificado
CensuraPaciente sin evento durante seguimiento
HazardRiesgo instantáneo
Kaplan-MeierSupervivencia no ajustada
CoxRiesgo ajustado

Paso 9. Selección de variables

Objetivo

Identificar las variables más relevantes para construir un modelo multivariado:

  • parsimonioso,
  • estable,
  • clínicamente interpretable,
  • metodológicamente adecuado.

¿Por qué seleccionar variables?

Porque incluir demasiadas variables puede producir:

  • sobreajuste,
  • colinealidad,
  • pérdida de precisión,
  • modelos difíciles de interpretar.

Estrategias de selección

MétodoCaracterística
ClínicaBasada en plausibilidad biológica
EstadísticaBasada en p valor
MixtaClínica + estadística
StepwiseAutomatizada
BackwardEliminación progresiva
ForwardInclusión progresiva

Recomendación en epidemiología clínica

La selección debe priorizar:

  • plausibilidad clínica,
  • confusión,
  • evidencia previa,
  • no solo p valor.

1. Modelo completo inicial

logistic control_pas i.tratamiento i.sexo c.edad c.imc c.pas_baseline c.adherencia_pct c.sodio_g_dia c.actividad_min_sem i.diabetes i.erc c.duracion_hta_anios

2. Evaluar variables significativas

Interpretar:

  • p valor,
  • IC95%,
  • relevancia clínica,
  • estabilidad de coeficientes.

Las siguientes variables no mostraron asociación estadísticamente significativa con el control de PAS en el modelo ajustado:

  • sexo,
  • edad,
  • IMC,
  • adherencia terapéutica,
  • consumo de sodio,
  • actividad física,
  • enfermedad renal crónica,
  • duración de hipertensión arterial.

3. Selección backward (eliminación progresiva)

Comando

stepwise, pr(.20): logistic control_pas tratamiento sexo edad imc pas_baseline adherencia_pct sodio_g_dia actividad_min_sem diabetes erc duracion_hta_anios

¿Qué significa pr(.20)?

Variables permanecen si:

p < 0.20

¿Por qué usar 0.20 y no 0.05?

Porque:

  • variables confusoras importantes pueden no ser altamente significativas,
  • evita excluir variables clínicamente relevantes demasiado temprano.
  • El método backward eliminó progresivamente variables sin contribución significativa al modelo:
    • edad,
    • ERC,
    • adherencia,
    • IMC,
    • actividad física,
    • duración de HTA,
    • sexo,
    • consumo de sodio.

  • El modelo final retainedo incluyó:
    • tratamiento,
    • PAS basal,
    • diabetes mellitus.

4. Comparar modelos

1. Modelo completo

logistic control_pas tratamiento sexo edad imc pas_baseline adherencia_pct sodio_g_dia actividad_min_sem diabetes erc duracion_hta_aniosestimates store completo

2. Modelo reducido

logistic control_pas tratamiento pas_baseline diabetesestimates store reducido

3. Comparación

lrtest completo reducido

Qué evalúa LR test

H0

El modelo reducido ajusta igual que el completo

Interpretación

ResultadoInterpretación
p >0.05Modelo reducido suficiente
p <0.05Modelo completo mejor

5. Selección clínica manual

Variables que usualmente deben mantenerse

Aunque no sean significativas:

  • edad,
  • sexo,
  • tratamiento,
  • diabetes,
  • variables principales de confusión.

Variables candidatas a excluir

VariableMotivo
adherencia_pctPosible mediador
actividad_min_semDébil asociación
variables redundantesColinealidad

Modelo final parsimonioso

Ejemplo:

logistic control_pas i.tratamiento c.edad c.pas_baseline i.diabetes

Evaluar estabilidad

Verificar cambios importantes

Si al retirar una variable:

  • el OR cambia >10–15%,
    → posible confusión.

Concepto importante

Variable significativa ≠ confusor

Una variable puede:

  • no ser significativa,
  • pero sí modificar el efecto principal.

Estrategia ideal en epidemiología clínica

Mantener:

  • variables clínicamente relevantes,
  • variables confusoras,
  • exposición principal,
    aunque:
  • no tengan p <0.05.

Riesgos del stepwise

Puede:

  • sobreajustar,
  • producir modelos inestables,
  • seleccionar variables por azar,
  • variar según muestra.

Por ello:

  • debe interpretarse con criterio clínico.


Descubre más desde Medicina Cardiometabólica

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario