1. Cargar el conjunto de datos:
Abrimos el archivo Excel en Stata:
import excel "ruta/graficos_basicos_stata.xlsx", sheet("Sheet1") firstrow clear
describe
2. Histogramas:
Los histogramas permiten visualizar la distribución de variables continuas.
a. Peso (distribución normal):
histogram peso, bin(10) normal title("Distribución del Peso")
- El gráfico muestra la frecuencia de pesos agrupados en intervalos.
- La curva normal superpuesta permite comparar con una distribución teórica.
b. Edad (distribución discreta):
histogram edad, bin(15) title("Distribución de la Edad")
- Ayuda a identificar grupos etarios más comunes en la muestra.
3. Diagramas de Caja (Boxplots):
Visualizan la dispersión, mediana y valores atípicos de una variable continua.
a. Peso por Género:
graph box peso, over(genero) title("Distribución del Peso por Género")
- Permite comparar la mediana y variabilidad del peso entre hombres y mujeres.
b. Altura por Grupo:
graph box altura, over(grupo) title("Altura por Grupo de Estudio")
- Útil para identificar diferencias en la altura entre grupos de intervención y control.
4. Gráficos de Dispersión (Scatter Plots):
Permiten visualizar la relación entre dos variables continuas.
a. Relación entre Peso y Altura:
scatter peso altura, title("Relación Peso vs. Altura")
- Muestra si hay una correlación positiva o negativa entre ambas variables.
b. Relación entre Edad y Actividad Física:
scatter actividad_fisica edad, title("Edad vs. Actividad Física")
- Identifica si las personas mayores realizan menos actividad física.
5. Gráficos de Barras (Bar Plots):
Visualizan la frecuencia de categorías.
a. Frecuencia de Diagnósticos (Enfermedad o No):
graph bar (count), over(diagnostico) title("Frecuencia de Diagnósticos")
- Permite ver cuántas personas tienen el diagnóstico (1) y cuántas no (0).
b. Actividad Física por Grupo:
graph bar (mean) actividad_fisica, over(grupo) title("Actividad Física por Grupo")
- Compara el promedio de actividad física entre el grupo de control e intervención.
6. Visualización de Distribuciones:
a. Densidad del Peso (Kernel Density Plot):
kdensity peso, title("Densidad del Peso") lcolor(blue)
- La curva suavizada permite observar la distribución continua del peso.
b. Gráfico de Puntos (Dot Plot) de Altura:
graph dot altura, over(genero) title("Altura por Género")
- Muestra la media de altura en cada categoría de género.
7. Exportación de Gráficos:
Podemos guardar los gráficos en formato de imagen:
graph export "histograma_peso.png", replace
graph export "boxplot_peso_genero.png", replace
- Utiliza el formato PNG para una mejor calidad en informes.
8. Interpretación de Gráficos:
- Histogramas: Identifican la distribución de variables continuas y su normalidad.
- Boxplots: Muestran la variabilidad y posibles outliers entre categorías.
- Scatter Plots: Evalúan relaciones entre dos variables continuas.
- Bar Plots: Visualizan comparaciones entre categorías.
- Density Plots: Observan distribuciones continuas suavizadas.
- Dot Plots: Comparan medias entre categorías de una variable.
twoway (scatter Glucosa IMC, mcolor(blue)) (lfit Glucosa IMC, lcolor(red)), title("IMC vs Glucosa con línea de regresión")

En el gráfico que compartiste, la línea de regresión (en rojo) muestra una pendiente levemente negativa, lo que indica que a medida que el IMC aumenta, la glucosa tiende a disminuir ligeramente. Sin embargo, la nube de puntos está bastante dispersa, lo que sugiere que la relación no es muy fuerte.
La palabra twoway se usa para indicar que vas a hacer un gráfico bidimensional, es decir, un gráfico en dos dimensiones que combina uno o más tipos de visualizaciones.
¿Por qué usar twoway?
Porque te permite:
- Combinar varios tipos de gráficos (como
scatter,line,lfit,qfit, etc.). - Superponer una línea de regresión (
lfit) sobre un gráfico de dispersión (scatter). - Tener más control sobre el diseño y presentación del gráfico.