📊 ANOVA

🎯 Pregunta de investigación

¿Existen diferencias en los niveles de glucosa según las categorías de IMC?

Grupos:

  • Normal
  • Sobrepeso
  • Obesidad

📌 ¿Cuándo corresponde ANOVA?

Cuando:

  • La variable dependiente es cuantitativa continua
  • La variable independiente es categórica con 3 o más grupos
  • La variable dependiente presenta distribución normal
  • Las varianzas son homogéneas

PASO 1. Explorar la variable y los grupos

tab imc_cat
summarize glucosa, detail

¿Qué buscamos?

  • Número de grupos
  • Distribución de glucosa
  • Media
  • Desviación estándar
  • Valores extremos

PASO 2. Evaluar normalidad por grupo

swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"

Interpretación

  • p > 0.05 → normal
  • p < 0.05 → no normal

Ejemplo esperado

Grupop valorInterpretación
Normal0.23Normal
Sobrepeso0.18Normal
Obesidad0.12Normal

Como todos los grupos presentan distribución normal, se puede usar ANOVA


PASO 3. Evaluar homogeneidad de varianzas

robvar glucosa, by(imc_cat)

Interpretación

  • p > 0.05 → varianzas iguales
  • p < 0.05 → varianzas diferentes

Ejemplo

p = 0.27

Interpretación

Las varianzas son homogéneas
Se puede aplicar ANOVA clásico


– Si las varianzas son diferentes (heterogeneidad de varianzas), el ANOVA clásico:

  • Aumenta error tipo I
  • Reduce validez del resultado
  • Puede generar conclusiones incorrectas

Por lo tanto:

❌ No se recomienda ANOVA clásico
✅ Se recomienda ANOVA de Welch


PASO 4. Describir la variable correctamente

Como los datos son normales, se describe con:

  • Media
  • Desviación estándar
tabstat glucosa, by(imc_cat) stat(n mean sd)

Ejemplo

GrupoMediaDE
Normal925
Sobrepeso1036
Obesidad1127

PASO 5. Aplicar ANOVA

anova glucosa imc_cat
encode imc_cat, gen(imc_cat_n)
anova glucosa imc_cat_n

Hipótesis

H0: Las medias son iguales en todos los grupos

H1: Al menos una media es diferente

Ejemplo resultado

F = 28.4
p < 0.001

Interpretación

  • p < 0.05
  • Se rechaza la hipótesis nula
  • Existen diferencias entre los grupos

Interpretación

  • p = 0.0000 (< 0.05)
  • Se rechaza la hipótesis nula

Conclusión:
Existen diferencias estadísticamente significativas en los niveles de glucosa según categoría de IMC.


PASO 6. Comparaciones múltiples (Post-hoc)

Como ANOVA salió significativo:

pwmean glucosa, over(imc_cat_n) mcompare(bonferroni)

Interpretación

  • Normal vs Sobrepeso → diferente
  • Normal vs Obesidad → diferente
  • Sobrepeso vs Obesidad → diferente

📌 Resultados

ComparaciónDiferenciaIC 95%Interpretación
Obesidad vs Normal17.1313.86 – 20.40Diferencia significativa
Sobrepeso vs Normal8.084.81 – 11.35Diferencia significativa
Sobrepeso vs Obesidad-9.05-12.31 – -5.78Diferencia significativa

📊 Interpretación estadística

Todas las comparaciones son significativas porque:

  • Ningún intervalo de confianza incluye 0
  • (Esto equivale a p < 0.05)

📊 Interpretación clínica

Se observa un gradiente claro:

Normal  <  Sobrepeso  <  Obesidad

Valores promedio aproximados:

GrupoGlucosa media
Normal93.8
Sobrepeso101.9
Obesidad110.9

Conclusión clínica

  • Pacientes con sobrepeso tienen glucosa mayor que normales
  • Pacientes con obesidad tienen glucosa mayor que sobrepeso
  • Existe una relación dosis-respuesta entre IMC y glucosa

Esto fortalece la plausibilidad causal.


PASO 7. Redacción para investigación

Métodos

Se compararon los niveles de glucosa entre las categorías de índice de masa corporal mediante análisis de varianza (ANOVA), previa verificación de normalidad y homogeneidad de varianzas.

Resultados

Se encontraron diferencias estadísticamente significativas en los niveles de glucosa según las categorías de IMC (F = 28.4; p < 0.001). Las comparaciones post hoc evidenciaron diferencias entre los grupos.


✅ Resumen del ejercicio ANOVA

Secuencia

  1. Identificar tipo de variables
  2. Ver normalidad por grupo
  3. Evaluar varianzas
  4. Describir con media y DE
  5. Aplicar ANOVA
  6. Si significativo → post hoc
  7. Conclusión

📌 DIFERENCIA

AspectoANOVAKruskal-Wallis
TipoParamétricaNo paramétrica
NormalidadNo
ComparaMediasRangos
ResumenMedia ± DEMediana + RIC
Post hocTukey / BonferroniDunn

🎯 Regla

Cuando queremos comparar una variable cuantitativa entre tres o más grupos:

  • Si hay normalidad → ANOVA
  • Si no hay normalidad → Kruskal-Wallis

📊 Comparación ANOVA vs Kruskal-Wallis (Mismos datos)

Pregunta de investigación:
¿Existen diferencias en glucosa según categorías de IMC?

Grupos:

  • Normal
  • Sobrepeso
  • Obesidad

1️⃣ ANOVA (Prueba Paramétrica)

Comando:

oneway glucosa imc_cat

Resultados

  • F = 0.97
  • p = 0.3832

Interpretación

ResultadoInterpretación
p > 0.05No hay diferencias entre grupos

👉 No hay diferencias estadísticamente significativas
👉 Las medias de glucosa son similares entre los grupos


Supuesto de varianzas

Resultado:

  • Bartlett = 4.1202
  • p = 0.127

👉 p > 0.05 → Varianzas homogéneas
👉 Se cumple supuesto de ANOVA


2️⃣ Kruskal-Wallis (Prueba No Paramétrica)

Comando:

kwallis glucosa, by(imc_cat)

Resultados

  • Chi² = 5.918
  • p = 0.0519

Interpretación

ResultadoInterpretación
p > 0.05No hay diferencias

👉 No hay diferencias estadísticamente significativas

⚠️ Pero:

👉 p = 0.0519 está muy cerca de 0.05
👉 Puede considerarse tendencia


📊 Comparación de ambas pruebas

Pruebap valorResultado
ANOVA0.3832No significativo
Kruskal-Wallis0.0519No significativo (tendencia)

🧠 Interpretación docente

Ambas pruebas muestran:

👉 No hay diferencias significativas
👉 Resultados consistentes

Esto es importante porque:

✔️ Ambas pruebas llegan a conclusión similar
✔️ Mayor confianza en resultados


🎓 Conclusión para alumnos

No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC, ni mediante ANOVA (F = 0.97; p = 0.383) ni mediante Kruskal-Wallis (χ² = 5.92; p = 0.052), aunque esta última mostró una tendencia cercana a la significancia.


📌 Mensaje clave

ANOVA → compara medias
Kruskal-Wallis → compara rangos

Ambos responden la misma pregunta con supuestos distintos.

📊 Pruebas previas antes de ANOVA y Kruskal-Wallis

Antes de comparar 3 o más grupos, se deben evaluar supuestos estadísticos.


🧠 1️⃣ Normalidad (por cada grupo)

📌 Evalúa si la variable continua sigue distribución normal

Pruebas

  • swilk → Shapiro-Wilk
  • sktest → Skewness-Kurtosis
  • histogram → Histograma
  • qnorm → Gráfico Q-Q
  • graph box → Boxplot (exploratorio)

Ejemplo

swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"

🧠 2️⃣ Homogeneidad de varianzas (solo para ANOVA)

📌 Evalúa si las varianzas son similares entre grupos

Pruebas

  • robvar → Levene / Brown-Forsythe
  • bartlett → Prueba de Bartlett
  • oneway → incluye Bartlett automáticamente

Ejemplo

robvar glucosa, by(imc_cat)

🎯 Decisión final

SupuestosPrueba
Normal + varianzas igualesANOVA
No normalKruskal-Wallis
Normal + varianzas diferentesWelch ANOVA / Kruskal-Wallis

📌 Resumen rápido

Antes de ANOVA

  • Normalidad
  • Homogeneidad de varianzas

Antes de Kruskal-Wallis

  • Evaluar normalidad (para justificar prueba no paramétrica)

🧠 Secuencia práctica

swilk variable por grupo
robvar variable, by(grupo)
anova o kwallis

📊 Pruebas posteriores a ANOVA y Kruskal-Wallis

Las pruebas posteriores (post hoc) se realizan solo si la prueba global es significativa (p < 0.05).


1️⃣ Pruebas posteriores a ANOVA (Paramétricas)

📌 Se usan cuando ANOVA es significativo

Pruebas más usadas

  • Bonferroni → conservadora (recomendada en clínica)
  • Tukey → muy utilizada
  • Scheffé → más conservadora
  • Sidak → alternativa a Bonferroni

En STATA

Bonferroni

pwmean glucosa, over(imc_cat) mcompare(bonferroni)

Tukey

pwmean glucosa, over(imc_cat) mcompare(tukey)

2️⃣ Pruebas posteriores a Kruskal-Wallis (No paramétricas)

📌 Se usan cuando Kruskal-Wallis es significativo

Pruebas más usadas

  • Dunn → más utilizada
  • Conover → alternativa
  • Dwass-Steel-Critchlow-Fligner (menos usada)

En STATA

Dunn

dunn glucosa, by(imc_cat)

⚠️ Puede requerir instalación:

ssc install dunn

📊 Resumen

Prueba principalPrueba posterior
ANOVABonferroni / Tukey
Kruskal-WallisDunn

🎯 Regla fácil para alumnos

ANOVA significativo → Bonferroni o Tukey
Kruskal significativo → Dunn

📌 Importante

❌ No hacer post hoc si:

p > 0.05

En tu ejemplo:

  • ANOVA → p = 0.383 ❌ No
  • Kruskal → p = 0.0519 ❌ No

👉 No corresponde pruebas posteriores


Descubre más desde Medicina Cardiometabólica

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario