En este ejercicio usamos los mismos datos, pero mostramos dos escenarios metodológicos distintos para fines docentes.
Es decir:
- 📊 Mismos datos
- 🧠 Dos enfoques estadísticos
- 🎓 Objetivo: enseñar cuándo usar ANOVA y cuándo Kruskal-Wallis
🎯 Explicación docente clara
Caso 1 — Asumiendo normalidad → ANOVA
Se usa cuando:
✔️ Variable continua
✔️ 3 o más grupos
✔️ Normalidad
✔️ Varianzas homogéneas
oneway glucosa imc_cat
Aquí comparamos medias
Caso 2 — Sin normalidad → Kruskal-Wallis
Se usa cuando:
❌ No hay normalidad
✔️ 3 o más grupos
kwallis glucosa, by(imc_cat)
Aquí comparamos rangos / distribuciones
📊 CLASE PRÁCTICA: ANOVA Y KRUSKAL-WALLIS
Primero haremos:
- Ejercicio completo de ANOVA
- Ejercicio completo de Kruskal-Wallis
1️⃣ EJERCICIO COMPLETO DE ANOVA
🎯 Pregunta de investigación
¿Existen diferencias en los niveles de glucosa según las categorías de IMC?
Grupos:
- Normal
- Sobrepeso
- Obesidad
📌 ¿Cuándo corresponde ANOVA?
Cuando:
- La variable dependiente es cuantitativa continua
- La variable independiente es categórica con 3 o más grupos
- Hay normalidad
- Hay homogeneidad de varianzas
PASO 1. Explorar la variable y los grupos
tab imc_cat
summarize glucosa
¿Qué buscamos?
- Número de grupos
- Tamaño de muestra por grupo
- Si la variable dependiente es continua
PASO 2. Evaluar normalidad por grupo
⚠️ Esto es clave: para ANOVA, la normalidad se revisa por grupo.
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
Interpretación
- p > 0.05 → compatible con normalidad
- p < 0.05 → no normal
Antes de usar ANOVA debemos verificar que la variable cuantitativa tenga distribución aproximadamente normal en cada uno de los grupos que vamos a comparar.
PASO 3. Evaluar homogeneidad de varianzas
oneway glucosa imc_cat
O también:
robvar glucosa, by(imc_cat)
Interpretación
- p > 0.05 → varianzas homogéneas
- p < 0.05 → no homogéneas
ANOVA asume que la variabilidad de la glucosa es parecida en los tres grupos. Si las varianzas son muy distintas, el ANOVA clásico puede no ser el más adecuado.
PASO 4. Aplicar ANOVA
oneway glucosa imc_cat
Hipótesis
- H0: todas las medias son iguales
- H1: al menos una media es diferente
Resultado que ya tienes
- F = 0.97
- p = 0.3832
Interpretación
- p > 0.05
- No se rechaza la hipótesis nula
No se encontraron diferencias estadísticamente significativas en la media de glucosa entre las categorías de IMC.
PASO 5. ¿Se necesitan pruebas post hoc?
Solo si ANOVA sale significativo.
Ejemplo:
pwmean glucosa, over(imc_cat) mcompare(bonferroni)
En tu caso:
- No aplica, porque p = 0.3832
PASO 6. Redacción para investigación
Métodos
Se compararon los niveles de glucosa entre las categorías de índice de masa corporal mediante análisis de varianza de una vía (ANOVA), previa verificación de normalidad por grupo y homogeneidad de varianzas.
Resultados
No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC (F = 0.97; p = 0.383). La prueba de Bartlett no mostró diferencias significativas en las varianzas entre los grupos (p = 0.127).
✅ Resumen
Secuencia
- Identificar tipo de variables
- Ver normalidad por grupo
- Ver homogeneidad de varianzas
- Aplicar ANOVA
- Si sale significativo → post hoc
Conclusión
En este ejemplo, ANOVA no mostró diferencias significativas de glucosa según IMC.
2️⃣ EJERCICIO COMPLETO DE KRUSKAL-WALLIS
🎯 Pregunta de investigación
¿Existen diferencias en los niveles de glucosa según las categorías de IMC?
Grupos:
- Normal
- Sobrepeso
- Obesidad
📌 ¿Cuándo corresponde Kruskal-Wallis?
Cuando:
- La variable dependiente es cuantitativa continua o al menos ordinal
- La variable independiente es categórica con 3 o más grupos
- La variable dependiente no sigue distribución normal
PASO 1. Explorar la variable y los grupos
tab imc_cat
summarize glucosa, detail
¿Qué buscamos?
- Número de grupos
- Distribución general de glucosa
- Mediana, percentiles, rango
PASO 2. Evaluar normalidad por grupo
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
Interpretación
Si uno o más grupos no tienen normalidad:
- Preferimos Kruskal-Wallis
Como la glucosa no presenta distribución normal en los grupos comparados, no es apropiado usar una prueba paramétrica clásica como ANOVA. En ese caso usamos Kruskal-Wallis.
PASO 3. Describir la variable como corresponde
Como no es normal, no se debe priorizar media y desviación estándar.
Se describe con:
- mediana
- rango intercuartílico
Ejemplo:
tabstat glucosa, by(imc_cat) stat(n median p25 p75)
En variables no normales, la mejor forma de resumir los datos es con mediana y rango intercuartílico.
PASO 4. Aplicar Kruskal-Wallis
kwallis glucosa, by(imc_cat)
Hipótesis
- H0: la distribución de glucosa es igual en todos los grupos
- H1: al menos un grupo difiere
Resultado que ya tienes
- chi² = 5.918
- p = 0.0519
Interpretación
- p > 0.05
- No se rechaza la hipótesis nula
- No hay diferencia estadísticamente significativa
- Pero hay una tendencia por estar muy cerca del punto de corte
No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC según la prueba de Kruskal-Wallis. Sin embargo, el valor p fue cercano a 0.05, por lo que podría considerarse una tendencia.
PASO 5. ¿Se necesitan comparaciones múltiples?
Solo si Kruskal-Wallis sale significativo.
Ejemplo:
dunn glucosa, by(imc_cat)
O según instalación del paquete correspondiente.
En tu caso:
- No aplica formalmente porque p = 0.0519
PASO 6. Redacción para investigación
Métodos
Debido a la ausencia de normalidad, se compararon los niveles de glucosa entre las categorías de índice de masa corporal mediante la prueba no paramétrica de Kruskal-Wallis.
Resultados
No se encontraron diferencias estadísticamente significativas en los niveles de glucosa según las categorías de IMC (χ² = 5.92; p = 0.052), aunque se observó una tendencia hacia diferencias entre grupos.
✅ Resumen docente del ejercicio Kruskal-Wallis
Secuencia
- Identificar tipo de variables
- Ver normalidad por grupo
- Describir con mediana y RIC
- Aplicar Kruskal-Wallis
- Si sale significativo → comparaciones post hoc
Conclusión
En este ejemplo, Kruskal-Wallis tampoco mostró diferencias significativas de glucosa según IMC, aunque el resultado fue cercano a la significancia.
📌 DIFERENCIA DOCENTE ENTRE AMBOS EJERCICIOS
| Aspecto | ANOVA | Kruskal-Wallis |
|---|---|---|
| Tipo de prueba | Paramétrica | No paramétrica |
| Requiere normalidad | Sí | No |
| Compara | Medias | Distribuciones/rangos |
| Resumen recomendado | Media ± DE | Mediana y RIC |
| Post hoc si significativo | Bonferroni, Tukey | Dunn |
Cuando queremos comparar una variable cuantitativa entre tres o más grupos, primero debemos revisar la distribución de los datos. Si la variable presenta distribución normal y las varianzas son homogéneas, usamos ANOVA. Si la variable no es normal, usamos Kruskal-Wallis. En ambos casos la hipótesis nula plantea que no existen diferencias entre grupos. En nuestro ejemplo, ni ANOVA ni Kruskal-Wallis encontraron diferencias estadísticamente significativas en los niveles de glucosa según categorías de IMC.
🧩 COMANDOS ORDENADOS PARA LA PRÁCTICA
Ejercicio ANOVA
tab imc_cat
summarize glucosa
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
oneway glucosa imc_cat
pwmean glucosa, over(imc_cat) mcompare(bonferroni)
Ejercicio Kruskal-Wallis
tab imc_cat
summarize glucosa, detail
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
tabstat glucosa, by(imc_cat) stat(n median p25 p75)
kwallis glucosa, by(imc_cat)
dunn glucosa, by(imc_cat)
📊 Comparación ANOVA vs Kruskal-Wallis (Mismos datos)


Pregunta de investigación:
¿Existen diferencias en glucosa según categorías de IMC?
Grupos:
- Normal
- Sobrepeso
- Obesidad
1️⃣ ANOVA (Prueba Paramétrica)
Comando:
oneway glucosa imc_cat
Resultados
- F = 0.97
- p = 0.3832
Interpretación
| Resultado | Interpretación |
|---|---|
| p > 0.05 | No hay diferencias entre grupos |
👉 No hay diferencias estadísticamente significativas
👉 Las medias de glucosa son similares entre los grupos
Supuesto de varianzas
Resultado:
- Bartlett = 4.1202
- p = 0.127
👉 p > 0.05 → Varianzas homogéneas
👉 Se cumple supuesto de ANOVA
2️⃣ Kruskal-Wallis (Prueba No Paramétrica)
Comando:
kwallis glucosa, by(imc_cat)
Resultados
- Chi² = 5.918
- p = 0.0519
Interpretación
| Resultado | Interpretación |
|---|---|
| p > 0.05 | No hay diferencias |
👉 No hay diferencias estadísticamente significativas
⚠️ Pero:
👉 p = 0.0519 está muy cerca de 0.05
👉 Puede considerarse tendencia
📊 Comparación de ambas pruebas
| Prueba | p valor | Resultado |
|---|---|---|
| ANOVA | 0.3832 | No significativo |
| Kruskal-Wallis | 0.0519 | No significativo (tendencia) |
🧠 Interpretación docente
Ambas pruebas muestran:
👉 No hay diferencias significativas
👉 Resultados consistentes
Esto es importante porque:
✔️ Ambas pruebas llegan a conclusión similar
✔️ Mayor confianza en resultados
🎓 Conclusión para alumnos
No se encontraron diferencias estadísticamente significativas en los niveles de glucosa entre las categorías de IMC, ni mediante ANOVA (F = 0.97; p = 0.383) ni mediante Kruskal-Wallis (χ² = 5.92; p = 0.052), aunque esta última mostró una tendencia cercana a la significancia.
📌 Mensaje clave
ANOVA → compara medias
Kruskal-Wallis → compara rangos
Ambos responden la misma pregunta con supuestos distintos.
📊 Pruebas previas antes de ANOVA y Kruskal-Wallis
Antes de comparar 3 o más grupos, se deben evaluar supuestos estadísticos.
🧠 1️⃣ Normalidad (por cada grupo)
📌 Evalúa si la variable continua sigue distribución normal
Pruebas
swilk→ Shapiro-Wilksktest→ Skewness-Kurtosishistogram→ Histogramaqnorm→ Gráfico Q-Qgraph box→ Boxplot (exploratorio)
Ejemplo
swilk glucosa if imc_cat=="Normal"
swilk glucosa if imc_cat=="Sobrepeso"
swilk glucosa if imc_cat=="Obesidad"
🧠 2️⃣ Homogeneidad de varianzas (solo para ANOVA)
📌 Evalúa si las varianzas son similares entre grupos
Pruebas
robvar→ Levene / Brown-Forsythebartlett→ Prueba de Bartlettoneway→ incluye Bartlett automáticamente
Ejemplo
robvar glucosa, by(imc_cat)
🎯 Decisión final
| Supuestos | Prueba |
|---|---|
| Normal + varianzas iguales | ANOVA |
| No normal | Kruskal-Wallis |
| Normal + varianzas diferentes | Welch ANOVA / Kruskal-Wallis |
📌 Resumen rápido
Antes de ANOVA
- Normalidad
- Homogeneidad de varianzas
Antes de Kruskal-Wallis
- Evaluar normalidad (para justificar prueba no paramétrica)
🧠 Secuencia práctica
swilk variable por grupo
robvar variable, by(grupo)
anova o kwallis
📊 Pruebas posteriores a ANOVA y Kruskal-Wallis
Las pruebas posteriores (post hoc) se realizan solo si la prueba global es significativa (p < 0.05).
1️⃣ Pruebas posteriores a ANOVA (Paramétricas)
📌 Se usan cuando ANOVA es significativo
Pruebas más usadas
- Bonferroni → conservadora (recomendada en clínica)
- Tukey → muy utilizada
- Scheffé → más conservadora
- Sidak → alternativa a Bonferroni
En STATA
Bonferroni
pwmean glucosa, over(imc_cat) mcompare(bonferroni)
Tukey
pwmean glucosa, over(imc_cat) mcompare(tukey)
2️⃣ Pruebas posteriores a Kruskal-Wallis (No paramétricas)
📌 Se usan cuando Kruskal-Wallis es significativo
Pruebas más usadas
- Dunn → más utilizada
- Conover → alternativa
- Dwass-Steel-Critchlow-Fligner (menos usada)
En STATA
Dunn
dunn glucosa, by(imc_cat)
⚠️ Puede requerir instalación:
ssc install dunn
📊 Resumen
| Prueba principal | Prueba posterior |
|---|---|
| ANOVA | Bonferroni / Tukey |
| Kruskal-Wallis | Dunn |
🎯 Regla fácil para alumnos
ANOVA significativo → Bonferroni o Tukey
Kruskal significativo → Dunn
📌 Importante
❌ No hacer post hoc si:
p > 0.05
En tu ejemplo:
- ANOVA → p = 0.383 ❌ No
- Kruskal → p = 0.0519 ❌ No
👉 No corresponde pruebas posteriores
Descubre más desde Medicina Cardiometabólica
Suscríbete y recibe las últimas entradas en tu correo electrónico.