📊 ANOVA y Kruskal-Wallis

En este ejercicio usamos los mismos datos, pero mostramos dos escenarios metodológicos distintos para fines docentes.

Es decir:

  • 📊 Mismos datos
  • 🧠 Dos enfoques estadísticos
  • 🎓 Objetivo: enseñar cuándo usar ANOVA y cuándo Kruskal-Wallis

🎯 Explicación docente clara

Caso 1 — Asumiendo normalidad → ANOVA

Se usa cuando:

✔️ Variable continua
✔️ 3 o más grupos
✔️ Normalidad
✔️ Varianzas homogéneas

oneway glucosa imc_cat

Aquí comparamos medias


Caso 2 — Sin normalidad → Kruskal-Wallis

Se usa cuando:

❌ No hay normalidad
✔️ 3 o más grupos

kwallis glucosa, by(imc_cat)

Aquí comparamos rangos / distribuciones


📊 CLASE PRÁCTICA: ANOVA Y KRUSKAL-WALLIS

Primero haremos:

  1. Ejercicio completo de ANOVA
  2. Ejercicio completo de Kruskal-Wallis

1️⃣ EJERCICIO COMPLETO DE ANOVA

🎯 Pregunta de investigación

¿Existen diferencias en los niveles de glucosa según las categorías de IMC?

Grupos:

  • Normal
  • Sobrepeso
  • Obesidad

📌 ¿Cuándo corresponde ANOVA?

Cuando:

  • La variable dependiente es cuantitativa continua
  • La variable independiente es categórica con 3 o más grupos
  • Hay normalidad
  • Hay homogeneidad de varianzas

PASO 1. Explorar la variable y los grupos

tab imc_cat
summarize glucosa

¿Qué buscamos?

  • Número de grupos
  • Tamaño de muestra por grupo
  • Si la variable dependiente es continua

PASO 2. Evaluar normalidad por grupo

⚠️ Esto es clave: para ANOVA, la normalidad se revisa por grupo.

swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"

Interpretación

  • p > 0.05 → compatible con normalidad
  • p < 0.05 → no normal

Antes de usar ANOVA debemos verificar que la variable cuantitativa tenga distribución aproximadamente normal en cada uno de los grupos que vamos a comparar.


PASO 3. Evaluar homogeneidad de varianzas

oneway glucosa imc_cat

O también:

robvar glucosa, by(imc_cat)

Interpretación

  • p > 0.05 → varianzas homogéneas
  • p < 0.05 → no homogéneas

ANOVA asume que la variabilidad de la glucosa es parecida en los tres grupos. Si las varianzas son muy distintas, el ANOVA clásico puede no ser el más adecuado.


PASO 4. Aplicar ANOVA

oneway glucosa imc_cat

Hipótesis

  • H0: todas las medias son iguales
  • H1: al menos una media es diferente

Resultado que ya tienes

  • F = 0.97
  • p = 0.3832

Interpretación

  • p > 0.05
  • No se rechaza la hipótesis nula

No se encontraron diferencias estadísticamente significativas en la media de glucosa entre las categorías de IMC.


PASO 5. ¿Se necesitan pruebas post hoc?

Solo si ANOVA sale significativo.

Ejemplo:

pwmean glucosa, over(imc_cat) mcompare(bonferroni)

En tu caso:

  • No aplica, porque p = 0.3832

PASO 6. Redacción para investigación

Métodos

Se compararon los niveles de glucosa entre las categorías de índice de masa corporal mediante análisis de varianza de una vía (ANOVA), previa verificación de normalidad por grupo y homogeneidad de varianzas.

Resultados

No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC (F = 0.97; p = 0.383). La prueba de Bartlett no mostró diferencias significativas en las varianzas entre los grupos (p = 0.127).


✅ Resumen

Secuencia

  1. Identificar tipo de variables
  2. Ver normalidad por grupo
  3. Ver homogeneidad de varianzas
  4. Aplicar ANOVA
  5. Si sale significativo → post hoc

Conclusión

En este ejemplo, ANOVA no mostró diferencias significativas de glucosa según IMC.



2️⃣ EJERCICIO COMPLETO DE KRUSKAL-WALLIS

🎯 Pregunta de investigación

¿Existen diferencias en los niveles de glucosa según las categorías de IMC?

Grupos:

  • Normal
  • Sobrepeso
  • Obesidad

📌 ¿Cuándo corresponde Kruskal-Wallis?

Cuando:

  • La variable dependiente es cuantitativa continua o al menos ordinal
  • La variable independiente es categórica con 3 o más grupos
  • La variable dependiente no sigue distribución normal

PASO 1. Explorar la variable y los grupos

tab imc_cat
summarize glucosa, detail

¿Qué buscamos?

  • Número de grupos
  • Distribución general de glucosa
  • Mediana, percentiles, rango

PASO 2. Evaluar normalidad por grupo

swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"

Interpretación

Si uno o más grupos no tienen normalidad:

  • Preferimos Kruskal-Wallis

Como la glucosa no presenta distribución normal en los grupos comparados, no es apropiado usar una prueba paramétrica clásica como ANOVA. En ese caso usamos Kruskal-Wallis.


PASO 3. Describir la variable como corresponde

Como no es normal, no se debe priorizar media y desviación estándar.

Se describe con:

  • mediana
  • rango intercuartílico

Ejemplo:

tabstat glucosa, by(imc_cat) stat(n median p25 p75)

En variables no normales, la mejor forma de resumir los datos es con mediana y rango intercuartílico.


PASO 4. Aplicar Kruskal-Wallis

kwallis glucosa, by(imc_cat)

Hipótesis

  • H0: la distribución de glucosa es igual en todos los grupos
  • H1: al menos un grupo difiere

Resultado que ya tienes

  • chi² = 5.918
  • p = 0.0519

Interpretación

  • p > 0.05
  • No se rechaza la hipótesis nula
  • No hay diferencia estadísticamente significativa
  • Pero hay una tendencia por estar muy cerca del punto de corte

No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC según la prueba de Kruskal-Wallis. Sin embargo, el valor p fue cercano a 0.05, por lo que podría considerarse una tendencia.


PASO 5. ¿Se necesitan comparaciones múltiples?

Solo si Kruskal-Wallis sale significativo.

Ejemplo:

dunn glucosa, by(imc_cat)

O según instalación del paquete correspondiente.

En tu caso:

  • No aplica formalmente porque p = 0.0519

PASO 6. Redacción para investigación

Métodos

Debido a la ausencia de normalidad, se compararon los niveles de glucosa entre las categorías de índice de masa corporal mediante la prueba no paramétrica de Kruskal-Wallis.

Resultados

No se encontraron diferencias estadísticamente significativas en los niveles de glucosa según las categorías de IMC (χ² = 5.92; p = 0.052), aunque se observó una tendencia hacia diferencias entre grupos.


✅ Resumen docente del ejercicio Kruskal-Wallis

Secuencia

  1. Identificar tipo de variables
  2. Ver normalidad por grupo
  3. Describir con mediana y RIC
  4. Aplicar Kruskal-Wallis
  5. Si sale significativo → comparaciones post hoc

Conclusión

En este ejemplo, Kruskal-Wallis tampoco mostró diferencias significativas de glucosa según IMC, aunque el resultado fue cercano a la significancia.


📌 DIFERENCIA DOCENTE ENTRE AMBOS EJERCICIOS

AspectoANOVAKruskal-Wallis
Tipo de pruebaParamétricaNo paramétrica
Requiere normalidadNo
ComparaMediasDistribuciones/rangos
Resumen recomendadoMedia ± DEMediana y RIC
Post hoc si significativoBonferroni, TukeyDunn

Cuando queremos comparar una variable cuantitativa entre tres o más grupos, primero debemos revisar la distribución de los datos. Si la variable presenta distribución normal y las varianzas son homogéneas, usamos ANOVA. Si la variable no es normal, usamos Kruskal-Wallis. En ambos casos la hipótesis nula plantea que no existen diferencias entre grupos. En nuestro ejemplo, ni ANOVA ni Kruskal-Wallis encontraron diferencias estadísticamente significativas en los niveles de glucosa según categorías de IMC.


🧩 COMANDOS ORDENADOS PARA LA PRÁCTICA

Ejercicio ANOVA

tab imc_cat
summarize glucosa
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
oneway glucosa imc_cat
pwmean glucosa, over(imc_cat) mcompare(bonferroni)

Ejercicio Kruskal-Wallis

tab imc_cat
summarize glucosa, detail
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
tabstat glucosa, by(imc_cat) stat(n median p25 p75)
kwallis glucosa, by(imc_cat)
dunn glucosa, by(imc_cat)

📊 Comparación ANOVA vs Kruskal-Wallis (Mismos datos)

Pregunta de investigación:
¿Existen diferencias en glucosa según categorías de IMC?

Grupos:

  • Normal
  • Sobrepeso
  • Obesidad

1️⃣ ANOVA (Prueba Paramétrica)

Comando:

oneway glucosa imc_cat

Resultados

  • F = 0.97
  • p = 0.3832

Interpretación

ResultadoInterpretación
p > 0.05No hay diferencias entre grupos

👉 No hay diferencias estadísticamente significativas
👉 Las medias de glucosa son similares entre los grupos


Supuesto de varianzas

Resultado:

  • Bartlett = 4.1202
  • p = 0.127

👉 p > 0.05 → Varianzas homogéneas
👉 Se cumple supuesto de ANOVA


2️⃣ Kruskal-Wallis (Prueba No Paramétrica)

Comando:

kwallis glucosa, by(imc_cat)

Resultados

  • Chi² = 5.918
  • p = 0.0519

Interpretación

ResultadoInterpretación
p > 0.05No hay diferencias

👉 No hay diferencias estadísticamente significativas

⚠️ Pero:

👉 p = 0.0519 está muy cerca de 0.05
👉 Puede considerarse tendencia


📊 Comparación de ambas pruebas

Pruebap valorResultado
ANOVA0.3832No significativo
Kruskal-Wallis0.0519No significativo (tendencia)

🧠 Interpretación docente

Ambas pruebas muestran:

👉 No hay diferencias significativas
👉 Resultados consistentes

Esto es importante porque:

✔️ Ambas pruebas llegan a conclusión similar
✔️ Mayor confianza en resultados


🎓 Conclusión para alumnos

No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC, ni mediante ANOVA (F = 0.97; p = 0.383) ni mediante Kruskal-Wallis (χ² = 5.92; p = 0.052), aunque esta última mostró una tendencia cercana a la significancia.


📌 Mensaje clave

ANOVA → compara medias
Kruskal-Wallis → compara rangos

Ambos responden la misma pregunta con supuestos distintos.

📊 Pruebas previas antes de ANOVA y Kruskal-Wallis

Antes de comparar 3 o más grupos, se deben evaluar supuestos estadísticos.


🧠 1️⃣ Normalidad (por cada grupo)

📌 Evalúa si la variable continua sigue distribución normal

Pruebas

  • swilk → Shapiro-Wilk
  • sktest → Skewness-Kurtosis
  • histogram → Histograma
  • qnorm → Gráfico Q-Q
  • graph box → Boxplot (exploratorio)

Ejemplo

swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"

🧠 2️⃣ Homogeneidad de varianzas (solo para ANOVA)

📌 Evalúa si las varianzas son similares entre grupos

Pruebas

  • robvar → Levene / Brown-Forsythe
  • bartlett → Prueba de Bartlett
  • oneway → incluye Bartlett automáticamente

Ejemplo

robvar glucosa, by(imc_cat)

🎯 Decisión final

SupuestosPrueba
Normal + varianzas igualesANOVA
No normalKruskal-Wallis
Normal + varianzas diferentesWelch ANOVA / Kruskal-Wallis

📌 Resumen rápido

Antes de ANOVA

  • Normalidad
  • Homogeneidad de varianzas

Antes de Kruskal-Wallis

  • Evaluar normalidad (para justificar prueba no paramétrica)

🧠 Secuencia práctica

swilk variable por grupo
robvar variable, by(grupo)
anova o kwallis

📊 Pruebas posteriores a ANOVA y Kruskal-Wallis

Las pruebas posteriores (post hoc) se realizan solo si la prueba global es significativa (p < 0.05).


1️⃣ Pruebas posteriores a ANOVA (Paramétricas)

📌 Se usan cuando ANOVA es significativo

Pruebas más usadas

  • Bonferroni → conservadora (recomendada en clínica)
  • Tukey → muy utilizada
  • Scheffé → más conservadora
  • Sidak → alternativa a Bonferroni

En STATA

Bonferroni

pwmean glucosa, over(imc_cat) mcompare(bonferroni)

Tukey

pwmean glucosa, over(imc_cat) mcompare(tukey)

2️⃣ Pruebas posteriores a Kruskal-Wallis (No paramétricas)

📌 Se usan cuando Kruskal-Wallis es significativo

Pruebas más usadas

  • Dunn → más utilizada
  • Conover → alternativa
  • Dwass-Steel-Critchlow-Fligner (menos usada)

En STATA

Dunn

dunn glucosa, by(imc_cat)

⚠️ Puede requerir instalación:

ssc install dunn

📊 Resumen

Prueba principalPrueba posterior
ANOVABonferroni / Tukey
Kruskal-WallisDunn

🎯 Regla fácil para alumnos

ANOVA significativo → Bonferroni o Tukey
Kruskal significativo → Dunn

📌 Importante

❌ No hacer post hoc si:

p > 0.05

En tu ejemplo:

  • ANOVA → p = 0.383 ❌ No
  • Kruskal → p = 0.0519 ❌ No

👉 No corresponde pruebas posteriores


Descubre más desde Medicina Cardiometabólica

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario