Factores asociados a infección por VIH y capacidad predictiva de un modelo clínico en adultos de una población urbana

🧩 1. PLANTEAMIENTO DEL PROBLEMA

La infección por VIH continúa siendo un importante problema de salud pública a nivel mundial. Diversos factores conductuales, biológicos y sociales influyen en el riesgo de infección y en la progresión de la enfermedad.

En poblaciones urbanas, variables como el número de parejas sexuales, el uso de preservativo, los antecedentes de infecciones de transmisión sexual (ITS), el consumo de drogas y la exposición a contactos con alta carga viral pueden modificar significativamente la probabilidad de infección.

Desde el punto de vista epidemiológico y clínico, resulta relevante identificar los factores asociados a la infección por VIH y evaluar la capacidad predictiva de modelos estadísticos que permitan discriminar pacientes con mayor riesgo.


🎯 2. OBJETIVOS

🔹 Objetivo general

Evaluar los factores asociados a la infección por VIH y determinar la capacidad predictiva de un modelo clínico en adultos de una población urbana.


🔹 Objetivos específicos

  1. Analizar la asociación entre variables clínicas y conductuales y la carga viral del paciente mediante regresión lineal.
  2. Identificar factores asociados a infección por VIH mediante regresión logística.
  3. Evaluar la capacidad discriminativa del modelo mediante curva ROC.
  4. Verificar los supuestos estadísticos necesarios para regresión lineal y logística.

💡 3. HIPÓTESIS

🔹 Hipótesis principal (modelo lineal)

La carga viral del paciente se asocia positivamente con:

  • Edad
  • Número de parejas sexuales
  • ITS previas
  • Consumo de drogas
  • Carga viral del contacto

y negativamente con:

  • Uso regular de preservativo.

🔹 Hipótesis secundaria (modelo logístico)

El mayor número de parejas sexuales, antecedentes de ITS, consumo de drogas y exposición a contactos con alta carga viral incrementan la probabilidad de infección por VIH.

El uso regular de preservativo actúa como factor protector.


🔹 Hipótesis de desempeño diagnóstico

El modelo clínico presenta adecuada capacidad discriminativa para identificar pacientes con infección por VIH.


📋 4. CUADRO DE VARIABLES

VariableTipoRolCodificación
carga_viral_pacienteContinuaDependiente (lineal)Copias/mL
vihDicotómicaDependiente (logística)1=VIH+, 0=VIH−
edadContinuaIndependienteAños
sexo_mDicotómicaIndependiente1=Masculino
imcContinuaIndependientekg/m²
numero_parejasContinua discretaIndependienteNúmero
uso_condonDicotómicaIndependiente1=Sí
its_previasDicotómicaIndependiente1=Sí
consumo_drogasDicotómicaIndependiente1=Sí
carga_viral_contactoContinuaIndependientelog10 copias/mL
cd4ContinuaCovariable clínicacélulas/mm³

📊 5. IMPORTAR BASE DE DATOS EN STATA

import excel "C:\ruta\dataset_vih_regresion_stata.xlsx", firstrow clear

Verificar variables:

describe

📈 6. ANÁLISIS DESCRIPTIVO

🔹 Variables continuas

summarize edad imc numero_parejas carga_viral_contacto cd4 carga_viral_paciente

Interpretar:

  • Media
  • Desviación estándar
  • Mínimo y máximo

🔹 Variables categóricas

tab vih
tab sexo_m
tab uso_condon
tab its_previas
tab consumo_drogas

Interpretar:

  • Frecuencias absolutas
  • Porcentajes

🔬 7. REGRESIÓN LINEAL

🎯 Outcome

carga_viral_paciente

🔹 Modelo

reg carga_viral_paciente edad imc numero_parejas uso_condon its_previas consumo_drogas carga_viral_contacto sexo_m, robust
reg carga_viral_paciente edad imc numero_parejas uso_condon its_previas consumo_drogas carga_viral_contacto sexo_m

🧠 INTERPRETACIÓN

IndicadorResultadoInterpretación
N400Tamaño muestral
F129.87Modelo significativo
p<0.001Asociación global significativa
0.7298Explica 72.98% de la variabilidad
Root MSE483.32Error promedio del modelo

📌 INTERPRETACIÓN DE β

VariableβpInterpretación
Edad11.59<0.001Cada año aumenta 11.6 unidades la carga viral
IMC-3.620.571No significativo
Número parejas225.65<0.001Cada pareja adicional aumenta 225.7 unidades
Uso condón-475.87<0.001Disminuye 475.9 unidades
ITS previas838.57<0.001Aumenta 838.6 unidades
Consumo drogas921.26<0.001Aumenta 921.3 unidades
Carga viral contacto571.07<0.001Cada unidad log10 aumenta 571.1 unidades
Sexo masculino72.190.147No significativo


✅ SUPUESTOS DE REGRESIÓN LINEAL


1️⃣ Normalidad de residuos

predict resid, resid

Histograma

histogram resid, normal

Q-Q plot

qnorm resid

Prueba estadística

swilk resid

Interpretación:

  • p > 0.05 → compatible con normalidad.
    Los residuos siguen una distribución compatible con normalidad.

2️⃣ Homocedasticidad

rvfplot

o

hettest

Interpretación:

  • p > 0.05 → varianza constante.
    Los residuos se distribuyen de forma aleatoria alrededor de cero, sin patrón en abanico evidente.

3️⃣ Multicolinealidad

vif

Interpretación:

VIFInterpretación
<5aceptable
>10colinealidad importante

4️⃣ Linealidad

avplots

Evaluar relación lineal entre predictores y outcome.


🔬 8. REGRESIÓN LOGÍSTICA

🎯 Outcome

vih

🔹 Modelo

logistic vih edad imc numero_parejas uso_condon its_previas consumo_drogas carga_viral_contacto sexo_m

📌 INTERPRETACIÓN

IndicadorResultado
N400
LR chi²41.89
p<0.001
Pseudo R²0.1169
VariableORpInterpretación
Edad1.040.011Cada año aumenta 4% los odds de VIH
IMC1.010.874No significativo
Número parejas1.020.786No significativo
Uso condón0.370.001Reduce 63% los odds de VIH
ITS previas2.700.001Aumenta 2.7 veces los odds
Consumo drogas1.890.077Tendencia, no significativo
Carga viral contacto1.880.001Aumenta 88% los odds
Sexo masculino1.220.500No significativo

✅ SUPUESTOS DE REGRESIÓN LOGÍSTICA


1️⃣ Outcome dicotómico

✔ VIH: 1/0


2️⃣ Independencia de observaciones

✔ Cada individuo independiente.


3️⃣ Ausencia de multicolinealidad (reg lineal)

vif

4️⃣ Linealidad del logit

linktest

Interpretación:

  • _hatsq no significativo indica que no hay evidencia de mala especificación.

5️⃣ Bondad de ajuste

estat gof

Interpretación:

  • p > 0.05 → buen ajuste.

📊 9. CURVA ROC

🔹 Comando

lroc

🧠 INTERPRETACIÓN DEL AUC

AUCInterpretación
0.5no discriminación
0.6–0.7pobre
0.7–0.8aceptable
0.8–0.9buena
>0.9excelente

📌 INTERPRETACIÓN CLÍNICA

Ejemplo:

AUC = 0.87

➡ El modelo tiene buena capacidad para diferenciar pacientes con y sin VIH.


📈 10. MATRIZ DE CLASIFICACIÓN

estat classification
SímboloSignificado
DDisease → paciente CON VIH
~DNo Disease → paciente SIN VIH

Permite obtener:

  • Sensibilidad
  • Especificidad
  • Correctamente clasificados