Evaluación de Supuestos y Normalidad en STATA


🎯 Objetivo de la práctica

Evaluar si las variables siguen distribución normal para decidir qué pruebas estadísticas utilizar posteriormente.


🧠 Flujo del análisis estadístico

1. Cargar datos
2. Identificar variables
3. Exploración descriptiva
4. Evaluación gráfica
5. Pruebas de normalidad
6. Interpretación
7. Decisión estadística

🟢 PASO 1. Cargar la base de datos

import excel "base_practica_no_normal.xlsx", firstrow clear

Verificar base:

describe

Ver primeras filas:

list in 1/10

🟢 PASO 2. Identificar variables

Variables continuas (evaluar normalidad)

  • edad
  • peso
  • glucosa
  • colesterol
  • presion_sys
  • presion_dia

Variables categóricas

  • sexo
  • hipertenso

⚠️ Solo las variables continuas se evalúan para normalidad


🟢 PASO 3. Exploración descriptiva

Primero explorar variables:

summarize edad peso glucosa colesterol presion_sys presion_dia, detail

🧠 Qué observar

  • Media
  • Mediana
  • Desviación estándar
  • Valores extremos
  • Asimetría

🟢 PASO 4. Evaluación gráfica de normalidad

4.1 Histograma

histogram edad, normal
histogram peso, normal
histogram glucosa, normal
histogram colesterol, normal
histogram presion_sys, normal
histogram presion_dia, normal

🧠 Interpretación

FormaInterpretación
🔔 CampanaNormal
↗ Sesgo derechaNo normal
↘ Sesgo izquierdaNo normal

🟢 PASO 5. Curva de densidad

kdensity edad
kdensity peso
kdensity glucosa
kdensity colesterol
kdensity presion_sys
kdensity presion_dia

🟢 PASO 6. Boxplot

graph box edad
graph box peso
graph box glucosa
graph box colesterol
graph box presion_sys
graph box presion_dia

🧠 Permite ver

  • Valores atípicos
  • Asimetría
  • Dispersión

🟢 PASO 7. Q-Q plot

qnorm edad
qnorm peso
qnorm glucosa
qnorm colesterol
qnorm presion_sys
qnorm presion_dia

🟢 PASO 8. Pruebas de normalidad

Shapiro-Wilk

swilk edad
swilk peso
swilk glucosa
swilk colesterol
swilk presion_sys
swilk presion_dia

Skewness y kurtosis

sktest edad
sktest peso
sktest glucosa
sktest colesterol
sktest presion_sys
sktest presion_dia

🟢 PASO 9. Interpretación

Regla general

ResultadoInterpretación
p > 0.05Normal
p ≤ 0.05No normal

🟢 PASO 10. Decisión estadística

Si variable normal

Comparación de medias:

ttest glucosa, by(hipertenso)

Correlación:

pwcorr glucosa edad, sig

Si variable no normal

Comparación:

ranksum glucosa, by(hipertenso)

Correlación:

spearman glucosa edad

🧪 Ejercicio práctico para estudiantes

Ejercicio 1

Evaluar normalidad de glucosa

summarize glucosa, detail
histogram glucosa, normal
kdensity glucosa
graph box glucosa
qnorm glucosa
swilk glucosa
sktest glucosa

🧪 Ejercicio 2

Evaluar normalidad de colesterol

summarize colesterol, detail
histogram colesterol, normal
kdensity colesterol
graph box colesterol
qnorm colesterol
swilk colesterol
sktest colesterol

🧪 Ejercicio 3

Evaluar normalidad de presión sistólica

summarize presion_sys, detail
histogram presion_sys, normal
kdensity presion_sys
graph box presion_sys
qnorm presion_sys
swilk presion_sys
sktest presion_sys

📌 Lista rápida de comandos

summarize, detail
histogram
kdensity
graph box
qnorm
swilk
sktest

🧠 Regla final para estudiantes

👉 No confiar solo en p-valor
👉 Evaluar gráficos
👉 Interpretar clínicamente


Descubre más desde Medicina Cardiometabólica

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario