Tema 6
Test con una muestra

Pedro Femia

22/mayo/2026

1 Introducción

\(\tiny \blacksquare \,\,\) En este tema finalizamos el análisis orientado a una sola muestra, que podemos resumir en estas tres facetas:

En los temas restantes abordaremos la inferencia sobre la asociación entre dos variables.


\(\tiny \blacksquare \,\,\) El tema actual se divide en dos partes:

  • Análisis de la normalidad
    Se trata de inferir si es asumible que un conjunto de observaciones muestrales tenga distribución normal, o no.

  • Contraste de hipótesis sobre un parámetro poblacional
    Se trata de los contrastes más sencillos y constituyen el punto de partida para comprender la metodología y la interpretación de la teoría de los contrastes de hipótesis. En este apartado nos centraremos únicamente en dos casos particulares:

    • En primer lugar, estudiaremos el contraste sobre la media de una variable cuantitativa (\(\small \text{H}_0:\mu=\mu_0\)), que ya fue desarrollado en el tema anterior, pero que se retoma ahora con el objetivo de situarlo dentro del conjunto de técnicas inferenciales aplicables a una sola muestra.
    • En segundo lugar, abordaremos el contraste sobre la proporción binomial (\(\small \text{H}_0:\pi=\pi_0\)), que permite analizar situaciones en las que la variable de interés es dicotómica.



2 Análisis de la normalidad

Introducción

\(\tiny \blacksquare \,\,\) Interés de la normalidad

Que la distribución de los datos se aproxime razonablemente a la distribución normal

  • Proporciona un perfil descriptivo que ayuda a explicar el fenómeno estudiado.
  • Justifica el uso de métodos paramétricos basados en esta distribución cuando el tamaño muestral no es lo suficientemente grande como para aplicar el teorema del límite central.

De cara a la inferencia, recordemos que

  • Los métodos paramétricos basados en la normalidad son bastante robustos frente a desviaciones moderadas de esta distribución.
  • Habitualmente, lo que interesa no es la normalidad de la variable en sí, sino la normalidad (aproximada) de la distribución de la media muestral.
    • Si el tamaño muestral es suficientemente grande, el teorema del límite central (TLC) permite asumir dicha aproximación normal.
    • Cuando el tamaño muestral no es grande, la forma de la distribución de la variable puede aportar información útil para valorar si la aproximación normal de la media muestral es razonable.

\(\tiny \blacksquare \,\,\) Métodos de análisis de la normalidad

  • Métodos gráficos. Permiten una evaluación visual de la adecuación de los datos a la distribución normal
    • Diagrama probabilístico normal (Q-Q plot). Compara los cuantiles muestrales con los cuantiles teóricos de una distribución normal. Una alineación aproximada de los puntos sobre una recta indica compatibilidad con la normalidad; desviaciones sistemáticas revelan asimetría, curtosis anómala o valores extremos.
    • Diagrama P-P (P-P plot). Es similar al anterior. Compara las probabilidades acumuladas empíricas con las probabilidades acumuladas teóricas de la normal. Es más sensible a discrepancias en la zona central de la distribución que a desviaciones en las colas. ← No los vemos en este curso
    • Histograma y curva de densidad estimada (KDE). Se pueden superponer en el mismo diagrama junto con el modelo de densidad normal. Recordemos que la forma del histograma está condicionada al número de intervalos, mientras que la curva KDE no.
    • Diagramas de caja. Permiten apreciar la simetría de la distribución y la presencia de valores atípicos.
       
  • Pruebas de normalidad
    • Contrastes estadísticos que evalúan formalmente la hipótesis de normalidad; existen múltiples test, con distinta potencia según el tamaño muestral.
       
  • Análisis de las medidas de forma
    • Contrastes sobre los coeficientes de forma: asimetría y curtosis (o apuntamiento) ← No los vemos en este curso


Diagramas probabilísticos normales

Diagramas cuantil-cuantil (Q-Q)

  • En el eje X se representan los cuantiles teóricos de la distribución de referencia.
  • En el eje Y se representan los cuantiles observados de la muestra.
  • Si ambas distribuciones coinciden, los puntos se alinean aproximadamente sobre una recta (normalmente la diagonal).
  • Cuando la distribución de referencia es la normal, el diagrama Q-Q es el diagrama probabilístico normal
Figura 1: Interpretación de los diagramas probabilísticos normales (Q-Q).
Ilustración de algunos perfiles de la distribución empírica y sus correspondientes representaciones en el diagrama Q-Q.
Fila superior: histogramas, curva KDE (azul) y perfil de la función de densidad normal (rojo).
Fila inferior: diagramas probabilísticos normales (Q-Q).
Otras figuras con forma de “S” aparecen cuando las colas son muy gruesas o muy delgadas


Perfiles de los diagramas probabilísticos normales
Figura 2: Forma de la función de densidad y su reflejo como patrón en los diagramas probabilísticos normales. En rojo, la distribución normal (D’Agostino (1998))




El diagrama probabilístico normal

  • Es especialmente recomendable como complemento —o incluso alternativa— a los contrastes de normalidad.
  • Permite evaluar cómo y dónde se incumple la normalidad (centro, colas, asimetría).
  • No depende de valores p ni de tamaños muestrales, como los contrastes de normalidad.
  • Al contrario que un test, este diagrama no da respuesta a la cuestión de si la variable es normal o no, sino que informa de cómo y cuánto se desvían –o no– los datos de la normalidad.
Los diagramas Q-Q, en general, no solo sirven para comparar una distribución empírica con una de referencia, también se pueden adaptar a la comparación de dos distribuciones empíricas entre sí (por ejemplo, muestras de una misma variable aleatoria observada en dos poblaciones distintas).

Pruebas de normalidad

Existen muchos test para contrastar si una variable observada tiene distribución normal o no

  • Test de Shapiro-Wilk ← Muy potente. Ideal para muestras pequeñas, demasiado potente para muestras grandes (detecta desviaciones triviales que le hacen perder su utilidad práctica). Suele ser la mejor opción para muestras de tamaño \(\small n\le 50-100\).
  • Test de Anderson-Darling ← Es una buena opción para detectar desviaciones en las colas de la distribución.
  • Test de Kolmogorov-Smirnov-Lilliefors ← Suele ser la alternativa al test de Shapiro-Wilk para muestras grandes.
  • Test de D’Agostino ← Útil para detectar asimetría en muestras grandes.
  • Test \(\small \chi^2\) ← Fue el primer test formal de normalidad. Desarrollado por Karl Pearson en 1900, actualmente está obsoleto, no usar.

En este curso, no vamos a desarrollar ninguno de los métodos. Lo importante es saber que hay muchas alternativas y la siguiente observación.

En todos los test:

  • La hipótesis nula es siempre la misma: \(\small \quad \text{H}_0: \text{la variable tiene distribución normal}\)
  • Por tanto, en todos los casos, si \(\small p<\alpha\) prefijado, se rechaza la hipótesis de normalidad.
  • Es habitual que el nivel de significación se fije en un valor \(\small \alpha \sim 0.10\) (en lugar del habitual \(\small \alpha=0.05\)), esto proporciona más potencia al test cuando la cuestión sobre la normalidad es importante (es una cuestión de autor).


Rendimiento de los métodos de evaluación de la normalidad

\(\tiny \blacksquare \,\,\) Cuando la muestra es de tamaño reducido

Es la situación en la que suele ser más relevante evaluar la normalidad, ya que no es plenamente aplicable el TLC. Sin embargo, una muestra pequeña aporta poca información, lo que provoca que:

  • Los contrastes de normalidad sean poco potentes, lo que implica que la falta de significación puede llevar a no rechazar la hipótesis nula e inducir erróneamente a considerarla cierta.
  • Los métodos gráficos puedan mostrar patrones aparentes (asimetrías, colas pronunciadas o incluso indicios de multimodalidad) que no reflejan necesariamente la estructura real de la distribución, sino la variabilidad muestral.

\(\tiny \blacksquare \,\,\) Cuando la muestra es de tamaño grande

  • Los contrastes, como el de Shapiro-Wilk, tienen mucha potencia, por lo que pueden detectar desviaciones muy pequeñas de la normalidad que no son relevantes en la práctica. En este contexto, se recomienda dar mayor peso al análisis gráfico y a la relevancia clínica o práctica.
  • En los métodos gráficos la inestabilidad visual propia de muestras pequeñas tiende a desaparecer conforme aumenta el tamaño muestral, dando lugar a representaciones más fieles del comportamiento poblacional.

\(\tiny \blacksquare \,\,\) En la práctica

Determinar si los datos proceden de una variable con distribución normal no siempre es sencillo.

  • Se debe combinar toda la información disponible: la aportada por los métodos gráficos y la de un contraste formal, recomendándose el uso del test de Shapiro–Wilk cuando el tamaño muestral no sea grande (< 50-100).
  • Si el tamaño muestral es moderado o grande (≈ 60 o superior), las desviaciones moderadas de la normalidad suelen dejar de ser problemáticas para la aplicación de métodos paramétricos basados en medias, en virtud del teorema del límite central y de la robustez de dichos métodos.


Ejemplo

Se dispone de 25 observaciones de la presión arterial sistólica de pacientes con hipertensión sometidos a tratamiento. Se trata de contrastar la normalidad de esta variable. Los datos son:

  • Hipótesis: Las observaciones proceden de una variable con distribución normal.

  • Nivel de significación: Establecemos \(\small \alpha =0.05\)

  • R Resolución:

1. Usando el código base de R
# Introducción de datos ----
TAS <- c(
  144.6,
  139.1,
  126.1,
  135.0,
  130.2,
  123.9,
  135.3,
  125.6,
  136.9,
  139.5,
  146.4,
  126.0,
  145.9,
  137.2,
  132.4,
  151.7,
  140.4,
  126.8,
  120.6,
  141.6,
  127.2,
  160.7,
  144.2,
  101.5,
  123.8
)

# test de Shapiro-Wilk ----
shapiro.test(TAS)

    Shapiro-Wilk normality test

data:  TAS
W = 0.96462, p-value = 0.5139
# Histograma con curva KDE ----
hist(TAS, freq = FALSE, col = "skyblue") # <-- histograma para la densidad
d <- density(TAS) # <-- valores de la curva KDE
lines(d, col = "navy", lwd = 2) # <-- Incorporación de la curva al histograma

# Diagrama Q-Q ----
qqnorm(TAS, col = "blue") # <-- genera el diagrama
qqline(TAS, col = "brown") # <-- le añade la línea de referencia



1. Usando el paquete BioestadisticaR2
library(BioestadisticaR2)
testnormal(
  TAS,
  qq = TRUE # <-- se pide el diagrama Q-Q
)

# Test de normalidad de Shapiro-Wilk  
 ------------------------------------- 
   n = 25,  W = 0.965,  p = 0.514 

  • Conclusión:
    El resultado del test de Shapiro-Wilk no lleva a rechazar la hipótesis de normalidad (\(\small p=0.514 > \alpha=0.05\)). El diagrama probabilístico normal (Q-Q) sugiere la presencia de colas relativamente largas, si bien la simetría, y el ajuste general, es aceptable. La curva de densidad (KDE) muestra un buen ajuste al modelo normal. Ambos diagramas, Q-Q y KDE, sugieren una posible mezcla de distribuciones normales; no obstante, dado el pequeño tamaño muestral (\(\small n=25\)), es frecuente que aparezcan patrones aparentes que desaparecen al incrementar el número de observaciones.
    En este contexto, el uso de métodos inferenciales basados en la normalidad se considera bien justificado, siendo un punto clave la aceptable simetría de la distribución. Además, los métodos paramétricos para la inferencia sobre la media son robustos frente a desviaciones moderadas de la normalidad.


Observación: Este ejemplo ilustra bien la subjetividad implícita en la agrupación en intervalos de un histograma y cómo la curva KDE es una representación preferible del perfil de la distribución. Compárese el histograma producido por la salida anterior con el código estándar de R y el del paquete BioestadisticaR2 (lo único que cambia es el número de intervalos)





3 Contraste de hipótesis sobre un parámetro

Un principio importante a tener en cuenta es que, en la práctica, la inferencia se debe fundamentar en la estimación mediante intervalos de confianza (IC). Debemos contemplar a los contrastes de hipótesis como herramienta complementaria para la toma de decisiones.

  • El IC informa sobre “¿Cuánto y con qué precisión?”
  • El contraste informa sobre si “¿Se cumple/no se cumple un criterio?”

En biomedicina (y cada vez más en Enfermería):



3.1 Contraste sobre la media de una variable cuantitativa

t-test para una media

Este test es el que hemos utilizado como ilustración de los conceptos fundamentales y de la metodología de los contrastes de hipótesis, desarrollados en el tema 5. Lo volvemos a presentar aquí para dar integridad a este tema 6 y considerar la resolución de un ejemplo práctico.

\(\tiny \blacksquare \,\,\) Hipótesis

Las hipótesis bilateral y unilaterales quedan formuladas por:

\[\qquad \begin{cases} \text{H}_0: & \mu = \mu_0 \\ \text{H}_1: & \mu \ne \mu_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \mu \ge \mu_0 \\ \text{H}_1: & \mu < \mu_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \mu \le \mu_0 \\ \text{H}_1: & \mu > \mu_0 \end{cases} \]

\(\tiny \blacksquare \,\,\) Información muestral

\[ \bar{x} = \text{media},\qquad s= \text{desviación típica},\qquad n = \text{tamaño muestral} \]

\(\tiny \blacksquare \,\,\) Estimadores puntuales

\[ \hat{\mu}=\bar{x},\qquad \hat{\sigma}=s \]

\(\tiny \blacksquare \,\,\) Métodos:

  • Test de Student (supuesta la distribución normal de la media muestral)

\(\tiny \blacksquare \,\,\) t-Test

  • Estadístico de contraste

\[ t_{\text{exp}}=\frac{\bar{x}-\mu_0}{{s/\sqrt{n}}} \]

  • Condición de validez

El método es válido si la distribución de la media muestral es normal.

  • Distribución

Bajo la hipótesis nula \(\small t_{\text{exp}} \sim t_{n-1}\)

  • Conclusión:

Informar del valor p y del intervalo de confianza (con \(\small \alpha\) tomando el mismo valor que el nivel de significación).



Ejemplo

En pacientes con hipertensión arterial, las guías clínicas establecen que una presión arterial sistólica media (PAS) inferior a 140 mmHg indica un buen control del tratamiento. Un laboratorio introduce un nuevo fármaco antihipertensivo y quiere evaluar si, tras 8 semanas de tratamiento, la presión arterial sistólica media de los pacientes tratados es inferior a 140 mmHg. Para ello, se consideró una muestra aleatoria de 25 pacientes con hipertensión. La media muestral fué de 134.5 mmHg con una desviación típica de 12.0 mmHg.

  • Hipótesis: \(\,\mu_0=140\). La alternativa de interés es la unilateral: \[\qquad \begin{cases} \text{H}_0: & \mu \ge 140 \\ \text{H}_1: & \mu < 140 \end{cases} \]

  • Nivel de significación: Establecemos \(\small \alpha=0.05\)

  • Información muestral y estimaciones puntuales: \[ n = 25, \qquad \bar{x} = 134.5, \qquad s=12.0,\qquad \hat{\mu}= 134.5, \hat{\sigma}= 12.0 \]

    Al tratarse de un test unilateral, verificamos que la información muestral es compatible con \(\small \text{H}_1\): \(\quad \small \bar{x}=134.5 <\mu_0=140\,\)

  • Método: Test de Student para una muestra. Su validez descansa en el supuesto de que la variable tenga distribución normal.

  • R Resolución:

1. Usando el código base de R
  • Con el código base solo es posible hacer el test para una media a partir de la información muestral completa.
  • Si solo se dispone de la información resumida (media y desviación típica), hay que utilizar funciones de otros paquetes, como son BSDA o BioestadisticaR2.
# La variable TAS es el vector definido en el análisis de la
# normalidad de la sección anterior

t.test(TAS, mu = 140, alternative = "less")

    One Sample t-test

data:  TAS
t = -2.2881, df = 24, p-value = 0.01562
alternative hypothesis: true mean is less than 140
95 percent confidence interval:
     -Inf 138.6136
sample estimates:
mean of x 
  134.504 

El intervalo de confianza que proporciona es, igual que el test, a una cola (no hemos estudiado este tipo de intervalos)

2. Usando el paquete BioestadisticaR2
  • Admite como argumentos tanto los valores resumen (n, media y desviación) como la muestra original

Con la muestra original

# La variable TAS es el vector definido en el análisis de la
# normalidad de la sección anterior

library(BioestadisticaR2)
testt(
  m = TAS,
  m0 = 140,
  grf = FALSE # <-- omite la salida gráfica
)

# t-Test con una muestra
# ----------------------

# Resumen de 'TAS'
    n = 25.000 
    media = 134.504 
    d.t. = 12.010 
    sem = 2.402 

# Estimación de la media μ:
  95%-IC(μ) = (129.546, 139.462) 

# Test de normalidad de Shapiro-Wilk:
  W = 0.965, gl = 25, p = 0.514 

# Test de Student para contrastar H₀:μ=μ₀ con μ₀=140.000
  texp = 2.288, gl = 24 
    p = 0.031 para la alternativa bilateral H₁:μ≠μ₀ 
    p = 0.016 para la alternativa unilateral H₁:μ<μ₀ 

  Estimación del efecto bruto 
  95%-IC(μ-μ₀) = (-10.454, -0.538) 
  • El resultado incluye el test de normalidad de Shapiro-Wilk
  • El intervalo proporcionado es bilateral

Con los valores resumidos

library(BioestadisticaR2)
testt(m = 134.5, s = 12, n = 25, m0 = 140)
  • La salida es igual a la anterior, salvo que se omite el test de Shapiro-Wilk, ya que sin los datos originales no es posible realizar un test de normalidad (en estos casos, habría que añadir que el resultado descansa en que la media muestral tenga distribución aceptablemente normal).

  • Conclusión

En la muestra analizada, la presión arterial sistólica media tras el tratamiento fue de 134.5 mmHg (s=12.0). El contraste mediante un test t de Student unilateral para una muestra mostró evidencia estadísticamente significativa para rechazar la hipótesis de una media poblacional de 140 mmHg al nivel del 5% (\(\small t_{exp}(24\,gl)=2.25, p=0.017\)). El intervalo de confianza bilateral para estimar la media fue 95%-IC=(129.5, 139.4), situado por debajo del umbral clínico de referencia. Estos resultados sugieren que el tratamiento evaluado podría ser eficaz para el control de la presión arterial sistólica, si bien deben confirmarse en estudios con mayor tamaño muestral.





3.2 Contraste sobre la proporción binomial

Test para una proporción

\(\tiny \blacksquare \,\,\) Hipótesis

Las hipótesis bilateral y unilaterales quedan formuladas por:

\[\qquad \begin{cases} \text{H}_0: & \pi = \pi_0 \\ \text{H}_1: & \pi \ne \pi_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \pi \ge \pi_0 \\ \text{H}_1: & \pi < \pi_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \pi \le \pi_0 \\ \text{H}_1: & \pi > \pi_0 \end{cases} \]

\(\tiny \blacksquare \,\,\) Información muestral

\[ \begin{cases} x = \text{número de casos con la característica de interés} \\ n = \text{número de casos totales} \end{cases} \]

\(\tiny \blacksquare \,\,\) Estimador puntual

\[ \hat{\pi}=p=\frac{x}{n} \]

\(\tiny \blacksquare \,\,\) Métodos:

  • Binomial exacto
  • Aproximación de la binomial a la normal

\(\tiny \blacksquare \,\,\) Aproximación de la binomial a la normal:

  • Estadístico de contraste

\[ z_{\text{exp}}=\frac{|p-\pi_0| - \frac{1}{2n}}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} \]

en donde \(\small \frac{1}{2n}\) es una corrección por continuidad.
El valor absoluto simplifica la aplicación de la cpc y devuelve \(\small z_{\text{exp}}\) siempre positivo.

  • Condición de validez

El método es válido si

\[ n\pi_0\ge 5, \text{y} \qquad n(1-\pi_0)\ge 5 \]

  • Distribución

Bajo la hipótesis nula \(\small z_{\text{exp}} \sim \mathcal{N}(0,1)\)

  • Conclusión:

Informar del valor p y del intervalo de confianza (con \(\small \alpha\) tomando el mismo valor que el nivel de significación).



Ejemplo

En un hospital se introduce un nuevo antibiótico para el tratamiento de una infección bacteriana. Históricamente, la tasa de curación con el tratamiento estándar es del 70%. Se desea evaluar si el nuevo antibiótico mejora la tasa de curación. Para ello se considera una muestra de 100 pacientes tratados con el nuevo antibiótico, de ellos 78 respondieron positivamente.

  • Hipótesis: \(\small \,\pi_0=0.70\). La alternativa de interés es la unilateral: \[\qquad \begin{cases} \text{H}_0: & \pi \le 0.70 \\ \text{H}_1: & \pi > 0.70 \end{cases} \]

  • Nivel de significación: Establecemos \(\small \alpha=0.05\)

  • Información muestral y estimación puntual: \[ x = 78, \qquad n = 100, \qquad \hat{\pi}=\frac{78}{100} = 0.78 \]

Verificamos que la información muestral es compatible con \(\small \text{H}_1\): \(\qquad \small p=0.78 >\pi_0=0.70\,\)

  • R Resolución:
1. Usando el código base de R
binom.test(x = 78, n = 100, p = 0.70, alternative = "greater")

    Exact binomial test

data:  78 and 100
number of successes = 78, number of trials = 100, p-value = 0.04787
alternative hypothesis: true probability of success is greater than 0.7
95 percent confidence interval:
 0.7009882 1.0000000
sample estimates:
probability of success 
                  0.78 
2. Usando el paquete BioestadisticaR2
library(BioestadisticaR2)
testp(x = 78, n = 100, p0 = 0.7)

# Test para contrastar una proporción binomial
# --------------------------------------------

# Información muestral
  n = 100
  x = 78   n-x=22
  p = 0.780; q = (1-p) = 0.220

# Test Ho:π=0.700
  [1] Método exacto
                      H1  Fexp Valor.p
    Cola derecha π>0.700 1.453   0.048
    Bilateral    π≠0.700     -   0.096

    95%-IC(π) = (0.709, 0.857) (método de Clooper-Pearson)

  [2] Método aproximado a la distribución normal
    Validez: min(nπ₀, n(1-π₀)) = 30.0 (>5, el método es válido)
    zexp = 1.637,  p  = 0.102

    95%-IC(π) = (0.684, 0.854) (método de Wilson)
# ATENCIÓN: el valor p devuelto por el método aprox. a la normal es para el test a dos colas, en un test a una cola hay que dividirlo por dos
  • Conclusión

En la muestra analizada, 78 de los 100 pacientes tratados con el nuevo antibiótico alcanzaron la curación (78%). El test binomial exacto mostró evidencia estadísticamente significativa para rechazar la hipótesis de una tasa de curación del 70% al nivel del 5% (p=0.048). El intervalo, al 95% de confianza, exacto para la proporción de curación, estimado mediante el método de Clopper–Pearson, fue (0.68, 0.85). En conjunto, estos resultados sugieren que el nuevo tratamiento podría asociarse con una mejora en la tasa de curación respecto al tratamiento estándar, si bien deben interpretarse con cautela y confirmarse en estudios adicionales que permitan evaluar su relevancia clínica y reproducibilidad.





4 Referencias y lecturas recomendadas

Agresti, A., & Kateri, M. (2022). Foundations of Statistics for Data Scientists With R and Python (1st Ed.). Chapman & Hall/CRC Texts in Statistical Science.
D’Agostino, R. B. (1998). Normality, Test of. En P. Armitage & T. Colton (Eds.), Encyclopedia of Biostatistics. Chichester; New York: John Wiley & Sons.
Gardner, M. J., & Altman, D. G. (1986). Confidence intervals rather than P values: estimation rather than hypothesis testing. British Medical Journal (Clinical Research Edition), 292(6522), 746-750. https://doi.org/10.1136/bmj.292.6522.746
Martín Andrés, A., & Luna del Castillo, J. de D. (2004). Bioestadística para las Ciencias de la Salud. Madrid: Norma.
Martín Andrés, A., & Luna del Castillo, J. de D. (2013). 40 ± 10 horas de Bioestadística. Madrid: Ed. Norma-Capitel.
Rosner, B. (2016). Fundamentals of Biostatistics (8.ª ed.). Boston: Brooks/Cole.



5 Material de este proyecto