[1] -2.200985
22/mayo/2026
\(\tiny \blacksquare \,\,\) Si bien la teoría de la estimación aborda el problema de cómo asignar valores a los parámetros poblacionales desconocidos,
la teoría de los contrastes de hipótesis se centra en cómo tomar decisiones basadas en la información que aportan los datos.
Para ello, habrá que transformar una pregunta clínica en una hipótesis estadística.
Ejemplo: efectividad de un tratamiento
En una unidad del hospital se implementa un nuevo protocolo de cambios posturales y cuidados de la piel, diseñado por el equipo de Enfermería para reducir la aparición de úlceras por presión (UPP) en pacientes encamados.
Tras varias semanas, parece que los pacientes desarrollan menos UPP que antes, pero surge la pregunta clave:
¿Esa reducción se debe realmente al protocolo… o simplemente al azar?
El equipo quiere tomar una decisión informada:
Para responder con rigor, se recoge información antes y después de la implantación y se compara la proporción de UPP en ambos periodos.
Aquí es donde entra en juego la estadística inferencial y, en particular, los contrastes de hipótesis.
Transformamos la pregunta clínica en una hipótesis estadística: Llamamos \(\small p_{\text{pre}}\) y \(\small p_{\text{post}}\) a las proporciones de UPP observadas antes y después del protocolo. La hipótesis a aceptar, o rechazar, es entonces:
\[
\large \pi_{\text{pre}}=\pi_{\text{post}}
\]
La teoría de los contrastes de hipótesis aporta las herramientas que van a permitir fundamentar las decisiones en la evidencia.
Un test, o contraste de hipótesis es un procedimiento estadístico mediante el cual, a partir de una muestra aleatoria obtenida de una población, se evalúa la evidencia disponible para decidir entre dos afirmaciones excluyentes sobre uno, o varios, parámetros poblacionales:
| Pregunta clínica | Parámetro(s) implicado(s) | Hipótesis estadísticas |
|---|---|---|
| ¿La media de hemoglobina en los pacientes tratados es significativamente mayor o igual a 12 g/dL? | Media poblacional: \(\mu\) | \(\small \begin{cases} \text{H}_0: & \mu \le 12 \\ \text{H}_1: & \mu > 12\end{cases}\) |
| ¿El programa de alta enfermera avanzada reduce la proporción de reingresos por debajo del 25% histórico? | Proporción poblacional: \(\pi\) | \(\small \begin{cases} \text{H}_0: & \pi \ge 0.25 \\ \text{H}_1: & \pi < 0.25 \end{cases}\) |
| ¿Existen diferencias en la presión arterial media entre dos tratamientos hipotensores alternativos? |
Medias de dos poblaciones: \(\mu_1\) y \(\mu_2\) |
\(\small \begin{cases} \text{H}_0: & \mu_1 = \mu_2 \\ \text{H}_1: & \mu_1 \ne \mu_2 \end{cases}\) |
| ¿Reduce los niveles de glucosa en ayunas la adherencia a un programa de actividad física supervisada? |
Media de las diferencias pre-post: \(\mu_{\text{dif}}\) |
\(\small \begin{cases} \text{H}_0: & \mu_{\text{dif}} \le 0 \\ \text{H}_1: & \mu_{\text{dif}} > 0 \end{cases}\) |
| La tasa de infección de herida quirúrgica ¿es igual en dos unidades hospitalarias? |
Proporciones poblacionales \(\pi_1\) y \(\pi_2\) |
\(\small \begin{cases} \text{H}_0: &\pi_1 =\pi_2 \\ \text{H}_1: & \pi_1 \ne \pi_2 \end{cases}\) |
| La variabilidad de la glucemia en ayunas ¿es la misma en pacientes tratados con dos tipos distintos de insulina? |
Varianzas poblacionales \(\sigma_1^2\) y \(\sigma_2^2\) |
\(\small \begin{cases} \text{H}_0: & \sigma_1^2 = \sigma_2^2 \\ \text{H}_1: & \sigma_1^2 \ne \sigma_2^2 \end{cases}\) |
La elección depende de la pregunta clínica, no de los datos.
Test bilateral (dos colas)
\[ \begin{cases} \text{H}_0: & \omega = \omega_0 \\ \text{H}_1: & \omega \ne \omega_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \omega_1 = \omega_2 \\ \text{H}_1: & \omega_1 \ne \omega_2 \end{cases} \]
para contrastes con una o dos muestras, respectivamente.
Test unilateral (una cola)
\[ \begin{cases} \text{H}_0: & \omega \le \omega_0 \\ \text{H}_1: & \omega > \omega_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \omega_1 \le \omega_2 \\ \text{H}_1: & \omega_1 > \omega_2 \end{cases} \]
o bien
\[ \begin{cases} \text{H}_0: & \omega \ge \omega_0 \\ \text{H}_1: & \omega < \omega_0 \end{cases}, \qquad \begin{cases} \text{H}_0: & \omega_1 \ge \omega_2 \\ \text{H}_1: & \omega_1 < \omega_2 \end{cases} \]
para contrastes con una o dos muestras, respectivamente.
En un test unilateral, la hipótesis alternativa presenta la desigualdad que se quiere demostrar fuera de duda.
Como veremos, habrá que comprobar siempre que la información muestral es compatible con este sentido de la diferencia.
Hipótesis nula (\(\small \text{H}_0\))
\[ \omega_\text{tto} = \omega_\text{ctrl} \]
Hipótesis alternativa (\(\small \text{H}_1\))
La decisión basada en la magnitud del estadístico de contraste nos va a servir para establecer más facilmente los elementos que aparecen en un test de hipótesis.
En la práctica, la que se suele usar es la decisión basada en la probabilidad.
Se desea evaluar si los pacientes con enfermedad renal crónica (ERC) en seguimiento por Enfermería presentan un nivel medio de filtrado glomerular estimado (eGFR) igual al valor normativo registrado para adultos sanos, establecido en 90 mL/min/1.73 m².
Para ello, se selecciona una muestra de 12 pacientes atendidos en la consulta y se registra su eGFR. Los valores observados fueron:
| Paciente | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| eGFR observado | 86 | 78 | 93 | 91 | 82 | 84 | 87 | 81 | 85 | 90 | 83 | 88 |
El objetivo es contrastar estadísticamente si la media poblacional del eGFR en estos pacientes coincide con el valor normativo de referencia.
La variable aleatoria bajo estudio es el nivel de filtrado glomerular estimado (eGFR) en pacientes con ECR. Esta es una variable continua y vamos a asumir que su distribución se ajusta aceptablemente a la distribución normal.
Considerando \(\small \mu\) la media poblacional del eGFR en pacientes con ERC y \(\mu_0=90\) el valor normativo, formulamos el contraste bilateral
\[ \begin{cases} \text{H}_0: & \mu = \mu_0 \\ \text{H}_1: & \mu \ne \mu_0 \end{cases} \qquad \Rightarrow \qquad \begin{cases} \text{H}_0: & \mu = 90 \\ \text{H}_1: & \mu \ne 90 \end{cases} \]
\[ n=12,\qquad \bar{x}=85.67,\qquad s=4.40 \]
Definición
Formalmente, un estadístico de contraste es una función de la muestra aleatoria, con distribución de probabilidad conocida (o aproximada) bajo la hipótesis nula, que se utiliza para decidir el rechazo o no rechazo de dicha hipótesis en un contraste de hipótesis.
Propuesta
\[ Z=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \tag{1}\]
La función
\[ t_\text{exp}=\frac{\bar{x}-\mu_0}{s/\sqrt{n}} \]
es un estadístico que combina la información observada en la muestra con la distribución propuesta bajo la hipótesis nula (una normal centrada en \(\small\mu_0\)). Como sustituimos \(\small\sigma\) por su estimador puntual, la distribución de referencia ahora es la t de Student con \(\small n-1\) grados de libertad. Esto se expresa como
\[t_\text{exp} \sim \mathcal{t}_{n-1}\]
El estadístico de contraste, a partir de los datos de filtración glomerular, es
\[ t_\text{exp}=\frac{\bar{x}-\mu_0}{s/\sqrt{n}} = \frac{85.67-90}{4.40/\sqrt{12}} = -3.41 \]
que tiene distribución t de Student con \(\small n-1 = 11\) grados de libertad.
Recordemos que la distribución t de Student es similar a la normal estándar:
Es importante asumir que siempre que se toma una decisión hay cierta probabilidad de equivocarse, de cometer un error
Se definine el error de tipo I como la probabilidad de rechazar la hipótesis nula cuando esta es cierta.
A esta probabilidad se la denota como \(\small \alpha\) (por extensión, se habla también de error \(\small \alpha\)), siendo
\[ \alpha = \Pr\left(\text{rechazar H}_0 | \text{es cierta H}_0\right) \]
Al fijar el nivel de significación, se está dividiendo el conjunto de valores que puede tomar el estadístico de contraste en dos regiones:
Si fijamos un nivel de significación del 5%, es decir \(\small\alpha=0.05\), el percentil \(\small t_{0.05/2}\) de la distribución t de Student con 11 grados de libertad se obtiene:
Decisión: Como \(\small |t_{\text{exp}}|=3.41 > |t_{\alpha/2}|=2.20\) \(\rightarrow\) El valor que toma el estadístico de contraste pertenece a la región crítica. Por tanto, rechazamos \(\small \text{H}_0\) a un nivel de significación \(\small \alpha\) del 5%.
Si el estadístico hubiera tomado, por ejemplo, el valor \(\small t_{\text{exp}}=-2.00\), al encontrarse dentro de la región de aceptación, habríamos concluido que –a un nivel de significación \(\small \alpha\) del 5%– la información muestral es compatible con la hipótesis nula, por tanto, no podemos rechazarla.
A continuación se presentan frases equivalentes para indicar el resultado de un test de hipótesis
| Frases equivalentes a aceptar la hipótesis nula | Frases equivalentes a rechazar la hipótesis nula |
|---|---|
| El test no es significativo. | El test es significativo. |
| La hipótesis nula explica adecuadamente los datos observados. | Los datos proporcionan evidencia suficiente contra la hipótesis nula. |
| La información muestral es compatible con la hipótesis nula. | Las evidencias muestrales son incompatibles con la hipótesis nula. |
| No encontramos evidencia estadísticamente significativa contra \(\small \text{H}_0\). | El resultado del test es estadísticamente significativo. |
| No se puede rechazar \(\small \text{H}_0\) al nivel de significación establecido. | Se rechaza \(\small \text{H}_0\) al nivel de significación establecido. |
| La evidencia disponible no sugiere un efecto o diferencia. | La evidencia disponible sugiere claramente un efecto o diferencia. |
| El estadístico toma un valor dentro de la región de aceptación. | El estadístico toma un valor dentro de la región crítica. |
| No observamos un resultado lo suficientemente extremo para cuestionar \(\small \text{H}_0\). | El resultado observado es suficientemente extremo como para cuestionar \(\small \text{H}_0\). |
CC-BY-SA
En el ejemplo de eGFR, la media muestral fue \(\small \bar{x}=85,67\), este valor sería incompatible con la hipótesis alternativa \(\small\text{H}_1:\mu>\mu_0=90\), puesto que es \(\small \bar{x}<\mu_0\) (observemos al ser \(\small t_{\text{exp}}\) negativo, nunca podría pertenecer a la región crítica de la cola derecha).
El valor p (en inglés p‑value) es la probabilidad, calculada bajo el supuesto de que la hipótesis nula es cierta, de obtener un resultado\(\small ^*\) al menos tan extremo como el observado en la muestra.
* Al aludir a un resultado debe entenderse al valor tomado por el estadístico de contraste.
El valor p mide cuánta evidencia aportan los datos en contra de la hipótesis nula:
CC-BY-SA
Decisión basada en el valor p:
Como veremos más adelante, valores de \(\small p>\alpha\) pero cercanos al nivel de significación generan una duda razonable: No se puede rechazar \(\small \text{H}_0\) ¿por que es cierta, o por que no hay suficiente evidencia (tamaño muestral) para poder rechazarla?
Recordemos que habíamos
Calculamos el valor P como la probabilidad de obtener un valor tan extremo, o más, que \(\small t_{\text{exp}}=-3.41\) bajo la distribución establecida por \(\small \text{H}_0\). Esto lo hacemos determinando qué percentil representa el valor \(\small -3.41\)
Pero nuestro test es bilateral, por tanto, tenemos que contemplar también la otra cola. Como la distribución es simétrica, basta con multiplicar el valor anterior por dos:
Si hubiera sido \(\small t_{\text{exp}}\) positivo, por ejemplo \(\small t_{\text{exp}}=3.41\), al estar situado en la cola derecha, el valor p se puede obtener de dos formas equivalentes
Por supuesto, en el test bilateral hay que multiplicar iguamente los valores obtenidos por dos: \(\small p= 0.0029\times 2=0.0058\)
Conclusión:
Suponiendo cierta la hipótesis nula, la probabilidad de observar un valor tan extremo o más que \(\small t_{\text{exp}}=-3.41\) es \(\small p=0.0058\) (el 5.8 por mil). Como \(\small p<\alpha\) consideramos, o bien que estamos observando un suceso muy raro, o bien que la hipótesis nula no explica los datos observados.
Nunca pensaremos que estamos ante un suceso raro, por tanto concluimos que la hipótesis nula no explica los datos observados, de manera que rechazamos esta hipótesis.
Esta conclusión la escribiríamos en un informe de forma parecida a la que sigue:
(…) en los pacientes con enfermedad renal crónica, se encontró una diferencia significativa entre el valor medio observado y el valor normativo para el filtrado glomerular estimado (p=0.006) (…)
La literatura científica esta llena da valores p, por ejemplo Song et al (2009)
Anteriormente consideramos el error que se comete al decidir rechazar \(\small \text{H}_0\) cuando es cierta. Se trataba del error de tipo I y su probabilidad se expresaba como
\[ \alpha = \Pr\left(\text{rechazar H}_0 | \text{es cierta H}_0\right) \]
Pero, también podemos cometer un error cuando decidimos no rechazar \(\small \text{H}_0\) cuando en realidad es falsa. A este error se le denomina error de tipo II, y su probabilidad se expresa como
\[ \beta = \Pr\left(\text{aceptar H}_0 | \text{no es cierta H}_0\right) \]
Así, si la decisión es
CC-BY-SA
La potencia de un test de hipótesis (\(\small \theta\)) es la probabilidad de rechazar correctamente a la hipótesis nula, es decir, de detectar correctamente a la alternativa:
\[ \theta = \Pr\left(\text{rechazar H}_0 | \text{no es cierta H}_0\right) \]
La potencia –y en consecuencia también la magnitud del error de tipo II– depende fundamentalmente de tres factores:
Es decir, de lo alejada que esté la distribución asociada a \(\small \text{H}_1\) de la propuesta por \(\small \text{H}_0\).
Para \(\small \alpha = 0.05\)
CC-BY-SA
CC-BY-SA
Para \(\small \alpha = 0.05\)
CC-BY-SA
En general:
Pero hay que tener siempre presente que
Como veremos, el resultado de un test de hipótesis debe ir acompañado por intervalos de confianza:
Un detalle importante:
El intervalo, a nivel de confianza \(\small 1-\alpha\), para estimar un parámetro, por ejemplo \(\small \mu\), contiene todos los valores \(\small \mu_0\) que no podrían ser rechazados como hipótesis nula en un test con un nivel de significación \(\small \alpha\). Es decir, un test de hipótesis al nivel \(\small \alpha\) es equivalente a comprobar si el valor de la hipótesis nula pertenece o no al intervalo de confianza al nivel \(\small (1-\alpha)\):
\[ \text{Si } \mu_0 \in IC_{1-\alpha} \Leftrightarrow p>\alpha \text{ en el test H}_0:\mu=\mu_0 \]
Observemos que hay dos probabilidades que se llaman \(\small \alpha\) pero que aluden a errores distintos, uno es un error de estimación y el otro un error de decisión.
Métodos paramétricos
Son aquellos que asumen que los datos siguen una distribución teórica conocida, típicamente la distribución normal,
Métodos no paramétricos
Son aquellos que no requieren asumir una distribución específica de la población, o lo hacen de forma mucho más laxa. Basados en rangos, signos o frecuencias, más que en los valores originales.
Son útiles cuando:
Son menos potentes que los paramétricos.
En la práctica:
CC-BY-SA
| Contraste de hipótesis (Estadística) | Test diagnóstico (Clínica / Enfermería) | Interpretación |
|---|---|---|
| Población de estudio | Conjunto de pacientes | El ámbito donde se quiere tomar una decisión |
| Muestra | Paciente individual | Unidad sobre la que se aplica el test |
| Hipótesis nula (\(\small \text{H}_0\)) | Paciente sano (ausencia de enfermedad) | Situación asumida por defecto |
| Hipótesis alternativa (\(\small \text{H}_1\)) | Paciente enfermo | Situación que requiere evidencia para ser aceptada |
| Estadístico de contraste | Resultado del test (biomarcador, prueba) | Información observada para tomar la decisión |
| Región de aceptación | Valores que se consideran clínicamente normales | Valores aceptables para lo que se asume por defecto |
| Región crítica | Valores que se consideran patológicos | Valores discrepantes con lo que se asume por defecto |
| Nivel de significación (\(\small \alpha\)) | Probabilidad de falso positivo | Riesgo aceptado de diagnosticar enfermedad en un sano |
| Error tipo I | Falso positivo | Declarar enfermo a un sano / declarar un efecto cuando no lo hay |
| Error tipo II (\(\small \beta\,\)) | Falso negativo | No detectar la enfermedad/efecto cuando realmente existe |
| Potencia (\(\small \theta=1-\beta\,\)) | Sensibilidad diagnóstica | Capacidad para detectar un efecto/enfermedad real |
| Valor p | Evidencia contra el estado sano | Compatibilidad de los datos con la ausencia de enfermedad |
| Decisión estadística | Decisión clínica | El test informa, pero no decide por sí solo |
Un contraste de hipótesis no “demuestra” nada, igual que un test no diagnostica por sí solo: ambos aportan evidencia para una decisión clínica o científica.
Bioestadística Aplicada a la Enfermería © 2026 por Pedro Femia, bajo licencia Creative Commons BY-NC-ND 4.0
.