Uso de distribuciones estadísticas en epidemiología


Objetivo:

Fomentar la comprensión del uso de distribuciones estadísticas en epidemiología clínica, analizando su aplicación en la interpretación de datos epidemiológicos y en la toma de decisiones clínicas.


Actividad:

  1. Introducción (10 minutos):
    • Breve presentación sobre qué son las distribuciones estadísticas y su relevancia en epidemiología.
    • Ejemplos: Distribución normal, binomial, Poisson y exponencial.
  2. Formación de Grupos (5 minutos):
    • Dividir a los estudiantes en grupos pequeños (3-4 personas).
    • Cada grupo recibirá un caso clínico o un conjunto de datos epidemiológicos.
  3. Discusión en Grupo (20 minutos):
    • Identificar la distribución estadística que mejor describe los datos proporcionados.
    • Justificar la elección de la distribución considerando la naturaleza de los datos y el contexto epidemiológico.
    • Discutir cómo el uso de la distribución seleccionada ayuda en la interpretación de los resultados.
  4. Plenaria (20 minutos):
    • Cada grupo presenta sus conclusiones brevemente.
    • Reflexión conjunta sobre las ventajas y limitaciones del uso de distribuciones estadísticas en estudios epidemiológicos.
  5. Cierre (5 minutos):
    • Síntesis de los principales puntos discutidos.
    • Conclusión sobre la importancia de elegir la distribución adecuada para el análisis de datos epidemiológicos.

Práctica Stata: Distribuciones estadísticas en epidemiología

practica_distribuciones_stataDescarga

Desarrollo de la práctica en Stata: Análisis de distribuciones estadísticas

1. Cargar el conjunto de datos:

Primero, abrimos el archivo Excel en Stata:

import excel "ruta/practica_distribuciones_stata.xlsx", sheet("Sheet1") firstrow cleardescribe

2. Análisis de la distribución normal (Presión Arterial)

a. Histograma de la presión arterial:

Visualizamos la distribución para comprobar si es aproximadamente normal.

histogram presion_arterial, normal title("Distribución de la Presión Arterial")

b. Prueba de normalidad (Shapiro-Wilk):

Esta prueba evalúa si la presión arterial sigue una distribución normal.

swilk presion_arterial

Interpretación:

  • p > 0.05: La variable sigue una distribución normal.
  • p ≤ 0.05: La variable no sigue una distribución normal.

c. Gráfico Q-Q (Quantile-Quantile Plot):

Compara los cuantiles de la variable con los cuantiles de una distribución normal.

qnorm presion_arterial

Interpretación:

Desviaciones significativas indican falta de normalidad.

Si los puntos siguen la línea diagonal, la variable es aproximadamente normal.

d. Boxplot para visualizar asimetría:

Permite identificar sesgos y valores atípicos.

graph box presion_arterial, title("Boxplot de Presión Arterial")

Interpretación:

Presencia de colas largas o asimetría indica falta de normalidad.

Una distribución simétrica sugiere normalidad.

ePrueba de Skewness/Kurtosis:

Compara la distribución de la muestra con una distribución normal estándar.

sktest presion_arterial

Interpretación:

p ≤ 0.05: Rechazo de la hipótesis de normalidad. Se rechaza la hipótesis nula de normalidad. La variable no sigue distribución normal.

p > 0.05: No hay evidencia contra la normalidad. No se rechaza la hipótesis de normalidad. La variable podría ser normal.

f. Asimetría y Curtosis:

Valores cercanos a 0 indican normalidad.

summarize presion_arterial, detail

🔹 Curtosis:

  • Valor cercano a 3: distribución similar a la normal.
  • Valor > 3: distribución más picuda (leptocúrtica).
  • Valor < 3: distribución más plana (platicúrtica).

🔹 Asimetría:

  • Valor cercano a 0: distribución simétrica.
  • Valor > 0: asimetría positiva (cola a la derecha).
  • Valor < 0: asimetría negativa (cola a la izquierda).

3. Análisis de la distribución binomial (Éxito/Fallo)

a. Tabla de frecuencias:

Verificamos la frecuencia de éxitos y fallos.

tabulate exito

b. Prueba binomial:

Evaluamos si la proporción de éxitos es del 60% (valor esperado).

bitest exito == 0.6

Interpretación:

  • p > 0.05: No hay diferencia significativa respecto al valor esperado.
  • p ≤ 0.05: Existe una diferencia significativa.
  • No hay evidencia suficiente para afirmar que la proporción de éxito en esta muestra (57%) sea diferente del 60% esperado.

4. Análisis de la distribución de Poisson (Casos de Dengue)

a. Promedio de casos:

Calculamos el promedio de casos de dengue por semana.

summarize casos_dengue

b. Gráfico de barras:

Visualizamos la frecuencia de casos por semana.

graph bar casos_dengue, over(semana) title("Casos de Dengue por Semana")

c. Ajuste del modelo de Poisson:

Evaluamos si el número de casos cambia según la semana.

poisson casos_dengue semana

Interpretación:

  • El coeficiente de la variable semana indica el cambio en el número de casos por unidad de tiempo.
  • Si el p-valor es significativo, existe una relación entre el tiempo y el número de casos.

LR chi2(1) = 0.02; p = 0.8768:

  • El modelo no es estadísticamente significativo, indicando que la variable «semana» no explica significativamente la variación en los casos de dengue.

Pseudo R2 = 0.0001:

  • El modelo tiene un poder explicativo muy bajo, prácticamente nulo.

5. Análisis de la distribución exponencial (Tiempo hasta el alta hospitalaria)

a. Descripción del tiempo hasta el alta:

Calculamos el promedio y la desviación estándar.

summarize tiempo_alta

b. Histograma:

Visualizamos la distribución del tiempo hasta el alta.

histogram tiempo_alta, bin(10) normal title("Tiempo hasta el Alta Hospitalaria")

c. Modelo exponencial:

Evaluamos la tasa de alta hospitalaria.

stset tiempo_alta, failure(exito == 1)

Interpretación:

  • El coeficiente de la tasa indica cuántas veces ocurre el alta por unidad de tiempo.
  • Un valor significativo sugiere que el tiempo influye en el alta.
    • Se analizarán 100 pacientes, seguidos desde el tiempo 0 hasta que ocurra el evento (exito == 1) o sean censurados.
    • Se registraron 57 eventos (casos en los que sí ocurrió el desenlace).
    • El análisis abarca un total de 469.99 unidades de tiempo en riesgo.
    • El último evento o censura ocurrió a los 21.22 días (o unidades de tiempo que represente tiempo_alta).
sts graph, title("Curva de Supervivencia Kaplan-Meier")

Conclusiones:

  • Distribución Normal: Evaluamos la presión arterial para determinar si sigue una curva de campana.
  • Distribución Binomial: Determinamos si la proporción de éxitos es la esperada.
  • Distribución de Poisson: Analizamos la frecuencia de casos de dengue por semana.
  • Distribución Exponencial: Medimos el tiempo hasta el alta hospitalaria y su tasa de ocurrencia.