Factores asociados a los niveles de glucosa y capacidad predictiva de un modelo clínico en adultos de una población urbana

🧩 1. PLANTEAMIENTO DEL PROBLEMA

La hiperglucemia constituye un factor clave en el desarrollo de diabetes mellitus tipo 2 y sus complicaciones cardiovasculares. En contextos urbanos, múltiples factores biológicos y conductuales influyen en los niveles de glucosa, lo que dificulta su predicción y control.

Además, en la práctica clínica es fundamental contar con herramientas que permitan predecir el riesgo de diabetes y evaluar el rendimiento de pruebas diagnósticas en comparación con un estándar de referencia.


🎯 2. OBJETIVOS

🔹 Objetivo general

Evaluar los factores asociados a los niveles de glucosa en sangre y determinar la capacidad predictiva de un modelo clínico para diabetes en adultos de una población urbana.


🔹 Objetivos específicos

  1. Analizar la asociación entre variables clínicas (edad, IMC, presión arterial, colesterol, actividad física, tabaquismo y antecedentes familiares) y los niveles de glucosa mediante regresión lineal.
  2. Identificar factores asociados a la presencia de diabetes mediante regresión logística.
  3. Evaluar la capacidad discriminativa del modelo mediante curva ROC.
  4. Determinar la validez diagnóstica de una prueba clínica en comparación con el estándar de referencia (gold standard), estimando sensibilidad, especificidad, valores predictivos y razones de verosimilitud.

💡 3. HIPÓTESIS

🔹 Hipótesis principal (modelo lineal)

Los niveles de glucosa en sangre se asocian positivamente con la edad, el índice de masa corporal, la presión arterial sistólica, el colesterol total, el tabaquismo y los antecedentes familiares, y negativamente con la actividad física semanal.


🔹 Hipótesis secundaria (modelo logístico)

La edad, el IMC, la presión arterial, el colesterol, el tabaquismo y los antecedentes familiares incrementan la probabilidad de presentar diabetes.


🔹 Hipótesis de desempeño diagnóstico

La prueba clínica evaluada presenta una adecuada capacidad diagnóstica para identificar diabetes en comparación con el estándar de referencia.


🧪 1. Análisis descriptivo

🔹 Comandos

summarize glucosa edad imc presion colesterol actividad_fisica diabetes fumador antecedentes_familiares sexo_m

🔹 Interpretación esperada

  • Variables continuas: reportar media ± DE
  • Variables categóricas: frecuencias (%)

La prevalencia de diabetes en la muestra es X% (según output), lo cual condicionará VPP y VPN en análisis diagnósticos.


📈 2. Regresión lineal (outcome: glucosa)

🔹 Modelo

reg glucosa edad imc presion colesterol actividad_fisica fumador antecedentes_familiares sexo_m, robust

🔹 Interpretación de coeficientes (ejemplo esperado)

VariableInterpretación
Edad↑ edad → ↑ glucosa
IMC↑ IMC → ↑ glucosa
Presión↑ PA → ↑ glucosa
Colesterol↑ colesterol → ↑ glucosa
Actividad física↑ actividad → ↓ glucosa
Fumadorfumadores → mayor glucosa
Antecedentes↑ riesgo glucémico

🔹 R²

El modelo explica aproximadamente X% de la variabilidad de la glucosa.

📌 En dataset simulado: probablemente alto


🔹 Conclusión

Existen asociaciones independientes entre factores clínicos y niveles de glucosa.


🔬 3. Regresión logística (outcome: diabetes_m)


🔹 Modelo

gen diabetes_m = glucosa >= 220
tab diabetes

logistic diabetes_m edad imc presion colesterol actividad_fisica fumador antecedentes_familiares sexo_m

🔹 Interpretación (OR)

Ejemplo:

VariableInterpretación
IMC (OR >1)↑ odds de diabetes
Actividad física (OR <1)efecto protector
Fumador↑ odds de diabetes

🔹 Conclusión

Los factores metabólicos y conductuales se asocian significativamente con la probabilidad de diabetes.


📊 4. Curva ROC

🔹 Comando

lroc

🔹 Interpretación

AUCInterpretación
0.7–0.8aceptable
0.8–0.9buena
>0.9excelente

🔹 Conclusión

El modelo presenta una capacidad discriminativa de tipo (según AUC) para identificar diabetes.
¿El modelo tiene una alta capacidad para diferenciar pacientes con y sin diabetes?