[1] -1.959964
[1] 1.959964
22/mayo/2026
\(\tiny \blacksquare \,\,\) La teoría de la estimación se centra en cómo dar valores a los parámetros de una población a partir de datos muestrales.
Hablamos, por tanto, de un método inferencial, que va a permitir tomar decisiones clínicas basadas en datos y no en intuiciones.
En el ámbito de la enfermería
Por ejemplo, en un estudio de enfermería podríamos preguntarnos:
En todos estos casos está implicado un parámetro poblacional desconocido:
La teoría de la estimación es la parte de la inferencia estadística que estudia cómo utilizar los datos de una muestra para aproximar el valor de un parámetro poblacional desconocido.
Recuerda que al pasar al ámbito formal (matemático), los parámetros poblacionales son los parámetros de un modelo de distribución de probabilidad.
Por lo tanto, en cada situación práctica, será imprescindible tener claro
Objetivo: Las tres preguntas básicas que permite responder la teoría de la estimación son:
Por estimación puntual se entiende el proceso de obtener un único valor a partir de la información muestral que se considere una buena aproximación para el parámetro poblacional desconocido.
Para ello, debemos resumir toda la información muestral en un solo valor, es decir, debemos considerar un estadístico.
Un estimador puntual es un estadístico calculado a partir de una muestra que permite obtener un (único) valor como aproximación de un parámetro poblacional desconocido.
En investigación en Enfermería:
Igual que en Enfermería no hay un único procedimiento válido para todos los pacientes,
en estadística no hay un único método de estimación válido para todos los problemas.
Por otra parte, algunos problemas de estimación admiten distintas aproximaciones usando diferentes enfoques
Estos son algunos de los métodos más comunes:
… y aún hay más.
Lo que se persigue es que el estadístico utilizado como estimador sea “el mejor” entre todos los candidatos posibles.
Esto se resume en las siguientes propiedades:
El estimador de máxima verosimilitud de la varianza poblacional es la varianza muestral (sin corregir el denominador):
\[ S^2=\frac{\sum{(x_i-\bar{x})^2}}{n} \]
Pero esta varianza, es un estimador sesgado de la varianza poblacional, la subestima sistemáticamente.
Friedrich Wilhelm Bessel (1784–1846) fue un astrónomo, matemático y físico alemán, conocido -entre otras cosas- por ser el primero en calcular la distancia precisa a una estrella.
En 1823, Bessel publicó un análisis sobre errores de observación en astronomía, donde detectó que la metodología habitual para calcular la varianza de una muestra subestimaba sistemáticamente la variabilidad real. Por ello introdujo la corrección que ahora lleva su nombre: \[ s^2=\frac{\sum{(x_i-\bar{x})^2}}{n-1} \]
En esencia, lo que ocurre es lo siguiente:
Estimación puntual
Conviene diferenciar claramente entre estimador y estimación:
Estimador es una función de la muestra (un estadístico) que se utiliza para aproximar el valor de un parámetro desconocido de la población.
Es, por tanto, una variable aleatoria, porque depende de los valores que tome la muestra.
Estimación es el valor numérico concreto que toma el estimador cuando se aplica a una muestra específica.
Ejemplo: Queremos conocer la proporción de pacientes con úlceras por presión en una sección del hospital. No podemos revisar a todos los pacientes, así que seleccionamos una muestra de 50 pacientes.
\(\bullet\;\) Si consideramos como estimador a la proporción muestral
\[ p=\frac{\text{número de pacientes con úlceras en la muestra}}{\text{número total de pacientes en la muestra}} \]
Esta proporción \(p\,\):
\(\bullet\;\) Por otra parte, la estimación es el valor concreto que obtenemos al aplicar el estimador a nuestra muestra.
Por ejemplo, si de los 50 pacientes 8 tienen úlceras por presión, la estimación sería:
\[ p=\frac{8}{50}=0.16 \qquad (16\%) \]
La idea es que:
Recordemos que los parámetros poblacionales, o los de los modelos de distribución de variables aleatorias, se denotan con letras del alfabeto griego para distinguirlos de los estadísticos muestrales.
Dado un parámetro genérico \(\theta\), la expresión \(\hat\theta\) se lee: estimador puntual de \(\theta\).
Parámetros y estimadores de las distribuciones que conocemos:
| Distribución | Magnitud |
Estadístico
(Muestra)
→ Se calcula |
Parámetro
(Población o modelo)
→ Se estima |
Estimador |
|---|---|---|---|---|
| Normal | Media | \(\bar{x}\) | \(\mu\) | \(\hat{\mu}=\bar{x}\) |
| Normal | Varianza | \(s^2\) | \(\sigma^2\) | \(\hat{\sigma}^2=s^2\) |
| Normal | Desviación típica | \(s\) | \(\sigma\) | \(\hat{\sigma}=s\) |
| Binomial | Proporción (dist. binomial) | \(p\) | \(\pi\) | \(\hat{\pi}=p\) |
| Poisson | Media y varianza | \(\bar{x}\) | \(\lambda\) | \(\hat{\lambda}=\bar{x}\) |
El estimador puntual proporciona el mejor valor para el parámetro poblacional que puede proporcionar la muestra
Esto puede ser suficiente cuando necesitemos reducir el resultado de la estimación a un único valor
Pero la estimación, como procedimiento inferencial, requiere cuantificar la incertidumbre inherente al muestreo:
CC-BY-SA
CC-BY-SA
CC-BY-SA
Si elegimos un nivel de probabilidad \(\small 1-\alpha\) para hacer un intervalo simétrico que contenga dicha probabilidad en la distribución normal estándar, este intervalo viene dado por los percentiles \(\small z_{\alpha/2}\) y \(\small z_{1-\alpha/2}\), de manera que se puede expresar
\[ \Pr\left(\,z_{\alpha/2}\,<\, z\, \le \, z_{1-\alpha/2} \right) = 1-\alpha \]
Asumiendo que \(\small \hat{\mu}=\bar{x}\) y haciendo la operación inversa a la tipificación para la distribución de la media muestral \(\small \mathcal{N}\left(\mu,\sigma/\sqrt{n} \right)\), este intervalo tendrá como límites
\[ \bar{x}+z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \quad\text{y} \quad \bar{x}+ z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}. \]
CC-BY-SA
Estos valores se suelen redondear a -1.96 y 1.96, respectivamente.
Cuidado con el signo: por simetría \(\small z_{0.975}=-z_{0.025}\), por lo tanto \(\small \bar{x}+z_{0.025}\,\frac{\sigma}{\sqrt{n}} \,\,=\,\,\bar{x}-1.96\,\frac{\sigma}{\sqrt{n}}\)
CC-BY-SA
Con todo lo anterior, llegamos a la expresión
\[ \Pr\left(\,\bar{x}+z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \,<\, \mu \le \, \bar{x}+ z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right) =1-\alpha \tag{1}\]
que es el intervalo de confianza, con nivel de confianza \((1-\alpha)\), para estimar la media de una variable aleatoria con distribución normal.
Con el nivel de confianza damos respuesta a la cuestión de qué incertidumbre tiene nuestra estimación.
CC-BY-SA
El intervalo de la Ecuación 1 puede expresarse también como “centro \(\pm\) radio”:
\[ \bar{x}\pm z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \]
El radio del intervalo representa su precisión (\(\delta\)):
\[ \delta = z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \]
CC-BY-SA
Cuidado: El termino precisión alude a la “estrechez” del intervalo; una precisión grande quiere decir un valor de \(\delta\) pequeño:
intervalo más estrecho = \(\delta\) de menor magnitud = intervalo más preciso.
¿De qué depende la precisión?
Con el nivel de precisión damos respuesta a la tercera cuestión que aborda la teoría de la estimación: permite aproximar el valor del parámetro poblacional, describir la incertidumbre asociada y valorar la precisión de la estimación.
El intervalo \[ \Pr\left(\,\bar{x}+z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \,<\, \mu \le \, \bar{x}+ z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right) =1-\alpha \]
desarrollado en la sección anterior presenta un problema: implica a \(\sigma\), un parámetro poblacional desconocido.
La solución natural es sustituir \(\sigma\) por su estimador muestral: \(s=\hat\sigma\)
Esto genera un nuevo inconveniente: William S. Gosset (1876-1937) observó que la incertidumbre adicional introducida al sustituir \(\sigma\) por su estimador puntual \(\large s\), provoca que la confianza real del intervalo sea menor al nivel \((1-\alpha)\) establecido. El efecto es tanto más acusado cuanto menor sea el tamaño muestral.
Para dar solución a este problema, Gosset desarrolló la distribución \(t\) de Student, que puede entenderse como una adaptación de la distribución normal cuando la varianza poblacional es desconocida (¡que es la situación más habitual en la práctica!) y en su lugar se utiliza la varianza muestral.
CC-BY-SA
Cómo obtener los percentiles \(\small \alpha/2\,\) y \(\,\small 1-\alpha/2\) de la distribución \(t\) con \(\small n-1\) grados de libertad:
Estos serían los valores a considerar en un intervalo al 95% de confianza con una muestra de tamaño \(\small n=11\) en lugar de \(\small \pm 1.96\).
En la práctica, el intervalo con nivel de confianza \(\small (1-\alpha)\), para estimar la media de una variable normal se obtiene siempre como:
\[ \large \Pr\left(\,\bar{x}+t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \,<\, \mu \le \, \bar{x}+ t_{1-\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \right) =1-\alpha \tag{2}\]
siendo \(s=\hat\sigma\).
Este intervalo también se puede expresar como
\[ \large \Pr\left(\, \mu \in \bar{x} \pm\, t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \right) =1-\alpha \tag{3}\]
Observemos que la precisión viene dada por:
\[ \large \delta = t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \tag{4}\]
Ahora, el tamaño muestral afecta a la precisión en dos puntos: determinando el valor de \(t_{\alpha/2;\,n-1}\) y como denominador de \(\delta\).
En los dos casos contribuye de la misma forma: por un lado, divide a \(\delta\), por otro, cuanto mayor sea \(n\), menor será el valor de \(\small t_{\alpha/2;\,n-1}\) (más se aproxima al de la normal \(\small z_{\alpha/2}\)), por lo tanto
mayor tamaño muestral \(\Rightarrow\) mayor precisión ( = valor de \(\delta\) menor)
La validez del intervalo de confianza dado por la Ecuación 3 se basa en el supuesto de que la distribución de la media muestral es normal.
Ahora bien, una muestra proporciona una sola media. Con un único valor no podemos evaluar si su distribución es normal o no.
El teorema del límite central (TLC) establece que la distribución de la media muestral será normal si se cumple al menos una de estas condiciones:
A partir de aquí, podemos concluir:
En la práctica, ante una estimación por intervalo, siempre debemos preguntarnos si es aceptable su precisión.
Ya hemos visto que la precisión depende de:
Como la precisión del intervalo es
\[ \large \delta = t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \]
podemos establecer una precisión objetivo, \(\,\delta_{\text{objetivo}}\), y saber qué valor de \(n\) la proporciona. Despejando \(n\) de la expresión anterior:
\[ \large n = \left(\frac{t_{\alpha/2;\, n-1}\,\, s}{\delta_{\text{objetivo}}} \right)^2 \]
Si todavía no hemos tomado ninguna muestra, esta expresión presenta dos problemas:
La conclusión es que para estimar el tamaño mínimo de muestra necesario para obtener un nivel de precisión \(\delta_{\text{objetivo}}\) al estimar una media \(\mu\) con un nivel de confianza de \((1-\alpha)\), es necesario disponer de una muestra piloto.
Una muestra piloto es un conjunto reducido de observaciones que se recoge antes del estudio principal, con el objetivo de anticipar problemas y estimar los parámetros necesarios para planificar correctamente el estudio final.
Con la información dada por la muestra piloto, ahora sí que podemos aproximar el tamaño mínimo de muestra necesario para cumplir con la precisión objetivo:
\[ \large n \ge \left(\frac{t_{\alpha/2;\, n_{\text{piloto}}-1}\,\, s_{\text{piloto}}}{\delta_{\text{objetivo}}} \right)^2 \tag{5}\]
Cuidado: el resultado de este cálculo es una variable aleatoria (implica a \(s=\hat\sigma\)), por tanto, puede ocurrir que al tomar una muestra del tamaño obtenido no se verifique la precisión objetivo.
Una vez tomada la muestra del tamaño estimado, hay que comprobar si la precisión obtenida es igual o mejor a la precisión objetivo, es decir, si se ha obtenido
\[ \delta_{\text{observado}} \le \delta_{\text{objetivo}}. \]
Si no ha ocurrido así, hay que recalcular la expresión de la Ecuación 5 con los nuevos valores de la muestra tomada.
Recuerda:
Gracias al TLC, sabemos que la media tiene distribución normal si:
Si la distribución es muy asimétrica y el tamaño muestral no es grande, el intervalo basado en la normalidad no es fiable (su nivel de confianza real no es el que hemos establecido para construirlo).
Otras opciones de estimación:
(Lo siguiente queda fuera de los objetivos de este curso, se indica solo a título informativo)
Cuando la normalidad de la distribución de la media no es asumible, las alternativas son:
La estimación de una proporción binomial es un problema clásico
Por ello, históricamente han surgido distintos métodos. El objetivo es encontrar un equilibrio entre:
Métodos de estimación
\[ \large p=\hat\pi, \qquad p \sim \mathcal{N} \left(\pi,\, \sqrt{\frac{\pi (1-\pi)}{n}} \right) \]
En la distribución se sutituye \(\small \pi\) por su estimador puntual \(\small p\), considerando entonces
\[ \large p \sim \mathcal{N} \left(p,\, \sqrt{\frac{p (1-p)}{n}} \right) \]
con lo que el intervalo, a nivel \(\small 1-\alpha\) se obtiene como
\[ \large p\,\pm\, z_{\alpha/2}\sqrt{\frac{p (1-p)}{n}} \]
Pero la sustitución de \(\small \pi\) por su estimador no siempre resulta adecuada. Cuando la muestra no es grande o si \(\small p\) es extrema
En la práctica:
La expresión del intervalo, para un nivel \(\small (1-\alpha)\) de confianza, es la siguiente:
\[ \frac{ \hat{p} + \frac{z_{\alpha/2}^{2}}{2n} }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \;\;\pm\;\; \frac{ z_{\alpha/2} \sqrt{ \frac{\hat{p}(1-\hat{p})}{n} + \frac{z_{\alpha/2}^{2}}{4n^{2}} } }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \]
Este intervalo es asimétrico respecto al estimador puntual.
En la práctica:
\[ \tilde{n}=n+4,\qquad \tilde{p}=\frac{x+2}{n+4} \]
y después aplicar el método de Wald con \(\small \tilde{n}\) y \(\small \tilde{p}\):
\[ \tilde{p} \;\pm\; z_{\alpha/2} \sqrt{ \frac{ \tilde{p}(1-\tilde{p}) }{ \tilde{n} } }. \]
A título informativo, la expresióon general del intervalo, para un nivel \(\small (1-\alpha)\) de confianza, es la siguiente:
\[ \frac{ \hat{p} + \frac{z_{\alpha/2}^{2}}{2n} }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \;\;\pm\;\; \frac{ z_{\alpha/2} \sqrt{ \frac{\hat{p}(1-\hat{p})}{n} + \frac{z_{\alpha/2}^{2}}{4n^{2}} } }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \]
En la práctica:
En la práctica:
| Método | Idea principal | Validez | Ventajas | Desventajas | Recomendación de uso |
|---|---|---|---|---|---|
| Wald (clásico) | Aproxima la distribución de la proporción a la normal. |
\(\small n\,p\) y \(\small n (1-p) \ge 20\). |
Muy simple de calcular. |
La confianza real puede ser inferior a \(\small 1-\alpha\) Intervalos inestables cerca de 0 y 1. |
Desaconsejado (salvo con \(\small n\) grande y proporciones equilibradas). |
| Wilson | Corrige el centro y la anchura del intervalo de Wald. |
\(\small n\, p\) y \(\small n\,(1-p) \ge 5\). |
Cumple con el nivel de confianza y son intervalos precisos. | Más complejo de explicar. | Es la mejor opción. |
| Agresti–Coull | Añade 2 éxitos y 2 fracasos antes de aplicar Wald. | Siempre. | Cumple con el nivel de confianza y es fácil de interpretar. | Ligeramente menos preciso que el de Wilson. | Muy recomendable (segunda mejor opción). |
| Clopper–Pearson (exacto) | Basado en la binomial (exacto). | Siempre. | Siempre cumple con el nivel de confianza exigido; matemáticamente riguroso. | Es conservador, da intervalos más amplios (menos precisos) de lo necesario. | Usar en situaciones que requieran la máxima seguridad. |
La estimación del tamaño mínimo de muestra necesario para estimar una proporción, con una precisión \(\small \delta_\text{objetivo}\) y un nivel de confianza \(\small (1-\alpha)\), se hace a partir del enfoque de Wald \[ n \;\ge\; \frac{ z_{\alpha/2}^2 \, p\,(1-p) }{ \delta^2 } \]
Poder estimar el tamaño mínimo de muestra sin muestra piloto no se puede hacer con otros parámetros:
El estimador puntual del parámetro es la media muestral:
\[ \hat\lambda = \bar{X} \]
Para obtener el intervalo de confianza, se pueden considerar dos métodos:
\[ \hat\lambda = \bar{X}, \quad y\quad \bar{X}\sim \mathcal{N}\left(\lambda,\, \sqrt{\frac{\lambda}{n}} \right) \] de manera que el intervalo, con nivel de confianza \(\small (1-\alpha)\) se construye como
\[ \bar{X} \pm \, z_{\alpha/2}\,\sqrt{\frac{\bar X}{n}}. \]
Esta expresión es apropiada cuando el tamaño muestral es suficientemente grande y la media muestral no es muy pequeña.
En general, la aproximación es
Cuando no se cumplen las condiciones anteriores, el nivel de confianza real puede ser inferior al prefijado.
Además, el desempeño del intervalo puede ser deficiente, con límites negativos.
Para determinar el tamaño de muestra necesario para que el intervalo de confianza para \(\small \lambda\) tenga una precisión objetivo \(\small \delta_{\text{objetivo}}\), es necesario disponer de una muestra piloto que permita hacer una estimación de la varianza (que en la Poisson es el propio \(\small\lambda\)).
A partir de esa estimación, se puede inferir el tamaño muestral como
\[ n \ge \frac{z_{\alpha/2}^2 \, \max \left(\hat \lambda\right) }{\delta_{\text{objetivo}}^2} \]
en donde \(\small \max \left(\hat \lambda\right)\) es el límite superior del intervalo de confianza obtenido a partir de la muestra piloto.
Enlaces:
Bioestadística Aplicada a la Enfermería © 2026 por Pedro Femia, bajo licencia Creative Commons BY-NC-ND 4.0
.