Tema 4 Estimación

1 Introducción

\(\tiny \blacksquare \,\,\) La teoría de la estimación se centra en cómo dar valores a los parámetros de una población a partir de datos muestrales.
Hablamos, por tanto, de un método inferencial, que va a permitir tomar decisiones clínicas basadas en datos y no en intuiciones.

En el ámbito de la enfermería

Permite caracterizar situaciones fisiológicas en función de los niveles de marcadores biológicos.
Es la base estadística de la vigilancia epidemiológica. La estimación de prevalencias, incidencias y riesgos, fundamentales para detectar problemas de salud en la población.
Ayuda a valorar la eficacia y seguridad de intervenciones. Estimar efectos (p. ej., reducción de PA, tasa de flebitis) permite determinar si un protocolo es realmente útil o seguro.
Permite planificar y evaluar programas de salud. Con estimadores fiables, se pueden establecer metas realistas y medir cambios en la salud de pacientes o comunidades.

Por ejemplo, en un estudio de enfermería podríamos preguntarnos:

¿Cuál es el nivel medio de hemoblobina en cada trimestre del embarazo?
¿Qué proporción de pacientes con movilidad reducida desarrolla una úlcera por presión durante la hospitalización?
¿Cuál es el número medio de infecciones nosocomiales por semana en una unidad de cuidados intensivos?

En todos estos casos está implicado un parámetro poblacional desconocido:

la media poblacional \(\mu\)
la proporción poblacional \(\pi\)
o el parámetro de Poisson \(\lambda\)

2 Qué es la teoría de la estimación

La teoría de la estimación es la parte de la inferencia estadística que estudia cómo utilizar los datos de una muestra para aproximar el valor de un parámetro poblacional desconocido.

Recuerda que al pasar al ámbito formal (matemático), los parámetros poblacionales son los parámetros de un modelo de distribución de probabilidad.

Por lo tanto, en cada situación práctica, será imprescindible tener claro

Cuál es la variable aleatoria que estamos estudiando: cómo se define y de qué tipo es.
Cuál es el modelo de distribución de probabilidad de esa variable aleatoria.

Objetivo: Las tres preguntas básicas que permite responder la teoría de la estimación son:

¿Cuál es el valor más plausible del parámetro?
¿Con qué precisión lo hemos estimado?
¿Qué incertidumbre tiene nuestra estimación?

3 Estimación puntual

Por estimación puntual se entiende el proceso de obtener un único valor a partir de la información muestral que se considere una buena aproximación para el parámetro poblacional desconocido.

Para ello, debemos resumir toda la información muestral en un solo valor, es decir, debemos considerar un estadístico.

Un estimador puntual es un estadístico calculado a partir de una muestra que permite obtener un (único) valor como aproximación de un parámetro poblacional desconocido.

Existen muchos métodos de estimación

En investigación en Enfermería:

La información puede aparecer con métricas diferentes:
- Presión arterial, glucemia (variables continuas).
- Úlceras por presión, infecciones (variables dicotómicas: sí/no).
- Escalas de dolor (escalas ordinales).
Las muestras pueden ser:
- Pequeñas (UCI, unidades específicas).
- Grandes (estudios multicéntricos).
A veces queremos:
- Simplicidad (fácil de explicar).
- Precisión (estimaciones eficientes).
- Robustez (que soporten bien la presencia de valores atípicos).
Los datos, aunque tengan la misma métrica, no siempre siguen la misma distribución.

Igual que en Enfermería no hay un único procedimiento válido para todos los pacientes,
en estadística no hay un único método de estimación válido para todos los problemas.

Por otra parte, algunos problemas de estimación admiten distintas aproximaciones usando diferentes enfoques

Métodos de estimación

Estos son algunos de los métodos más comunes:

Método analógico o de los momentos: Utiliza los análogos muestrales (media, varianza) para estimar parámetros poblacionales.
Método de Máxima Verosimilitud: Busca el valor del parámetro que maximiza la probabilidad de observar los datos obtenidos.
Estimación Bayesiana: Combina información previa (distribución a priori) con datos observacionales para calcular la distribución a posteriori del parámetro.
Método de mínimos cuadrados: Se utiliza para ajustar un modelo a los datos minimizando la suma de los cuadrados de las diferencias entre los valores observados y los predichos. Veremos este método en el último capítulo, dedicado a la regresión lineal.
Bootstrap: método de remuestreo que permite estimar la distribución de un estimador al tomar múltiples muestras con reemplazo de los datos originales, útil para calcular intervalos de confianza y errores estándar.

… y aún hay más.

Propiedades deseables en un estimador

Lo que se persigue es que el estadístico utilizado como estimador sea “el mejor” entre todos los candidatos posibles.
Esto se resume en las siguientes propiedades:

Insesgadez: el valor esperado del estimador debe ser igual al parámetro poblacional que está estimando. Es decir, no debe ni sobreestimar ni subestimar sistemáticamente.
Consistencia: a medida que el tamaño de muestra aumenta, el estimador debe aproximarse cada vez mejor al verdadero valor del parámetro.
Eficiencia: el estimador, que es una variable aleatoria, debe tener la menor varianza posible.
Robustez: es deseable que sea resistente a la influencia de observaciones extremas.

El cumplimiento de estas propiedades permite garantizar que el estimador sea confiable y útil en la práctica.

Un ejemplo ilustrativo

El estimador de máxima verosimilitud de la varianza poblacional es la varianza muestral (sin corregir el denominador):

\[ S^2=\frac{\sum{(x_i-\bar{x})^2}}{n} \]

Pero esta varianza, es un estimador sesgado de la varianza poblacional, la subestima sistemáticamente.

Friedrich Wilhelm Bessel (1784–1846) fue un astrónomo, matemático y físico alemán, conocido -entre otras cosas- por ser el primero en calcular la distancia precisa a una estrella.

En 1823, Bessel publicó un análisis sobre errores de observación en astronomía, donde detectó que la metodología habitual para calcular la varianza de una muestra subestimaba sistemáticamente la variabilidad real. Por ello introdujo la corrección que ahora lleva su nombre: \[ s^2=\frac{\sum{(x_i-\bar{x})^2}}{n-1} \]

En esencia, lo que ocurre es lo siguiente:

Cuando calculamos una varianza en una muestra, usamos la media de esa misma muestra.
Eso hace que las desviaciones parezcan más pequeñas de lo que realmente deberían ser: la media muestral raramente va a coincidir de forma exacta con la media poblacional y ya sabemos que el criterio de centralidad de la media consiste, precisamente, en ser el valor que minimiza la suma de distancias de todas las observaciones.
Bessel descubrió esto en 1823 y propuso dividir entre \(n−1\) en vez de \(n\).
Gracias a su corrección, la estimación de la varianza, utilizando como estimador al estadístico \(s^2\), es insesgada (deja de estar subestimada de forma sistemática).

Estimación puntual

Estimador y estimación

Conviene diferenciar claramente entre estimador y estimación:

Estimador es una función de la muestra (un estadístico) que se utiliza para aproximar el valor de un parámetro desconocido de la población.
Es, por tanto, una variable aleatoria, porque depende de los valores que tome la muestra.
Estimación es el valor numérico concreto que toma el estimador cuando se aplica a una muestra específica.

Ejemplo: Queremos conocer la proporción de pacientes con úlceras por presión en una sección del hospital. No podemos revisar a todos los pacientes, así que seleccionamos una muestra de 50 pacientes.

\(\bullet\;\) Si consideramos como estimador a la proporción muestral

\[ p=\frac{\text{número de pacientes con úlceras en la muestra}}{\text{número total de pacientes en la muestra}} \]

Esta proporción \(p\,\):

Es una variable aleatoria, su valor dependerá de qué pacientes entren en la muestra.
Es la regla de cálculo, todavía no ha tomado ningún valor.

\(\bullet\;\) Por otra parte, la estimación es el valor concreto que obtenemos al aplicar el estimador a nuestra muestra.
Por ejemplo, si de los 50 pacientes 8 tienen úlceras por presión, la estimación sería:

\[ p=\frac{8}{50}=0.16 \qquad (16\%) \]

La idea es que:

El estimador es la herramienta que usamos para aproximarnos a la realidad.
La estimación es el número que obtenemos aplicando esa herramienta a los datos de la muestra.

Parámetros y sus estimadores de interés

Recordemos que los parámetros poblacionales, o los de los modelos de distribución de variables aleatorias, se denotan con letras del alfabeto griego para distinguirlos de los estadísticos muestrales.

Dado un parámetro genérico \(\theta\), la expresión \(\hat\theta\) se lee: estimador puntual de \(\theta\).

Parámetros y estimadores de las distribuciones que conocemos:

Distribución	Magnitud	Estadístico (Muestra) → Se calcula	Parámetro (Población o modelo) → Se estima	Estimador
Normal	Media	\(\bar{x}\)	\(\mu\)	\(\hat{\mu}=\bar{x}\)
Normal	Varianza	\(s^2\)	\(\sigma^2\)	\(\hat{\sigma}^2=s^2\)
Normal	Desviación típica	\(s\)	\(\sigma\)	\(\hat{\sigma}=s\)
Binomial	Proporción (dist. binomial)	\(p\)	\(\pi\)	\(\hat{\pi}=p\)
Poisson	Media y varianza	\(\bar{x}\)	\(\lambda\)	\(\hat{\lambda}=\bar{x}\)

¿Es suficiente con la estimación puntual?

El estimador puntual proporciona el mejor valor para el parámetro poblacional que puede proporcionar la muestra

Esto puede ser suficiente cuando necesitemos reducir el resultado de la estimación a un único valor

Pero la estimación, como procedimiento inferencial, requiere cuantificar la incertidumbre inherente al muestreo:

¿Es fiable el valor obtenido?
¿Qué nivel de precisión tiene?

Figura 1: Dos muestreos sobre la misma población generan estimaciones diferentes
¿cuál es mejor?
¿en qué se aprecia que en la muestra 2 hay mucha más información (\(n_2=200\)) que en la muestra 1 (\(n_1=30\))?

(c) Pedro Femia bajo licencia

CC-BY-SA

La media muestral es una variable aleatoria (continua)

Figura 2: Independientemente de cuál sea la variable original, la muestral es una variable aleatoria siempre continua

(c) Pedro Femia bajo licencia

CC-BY-SA

4 Estimación por intervalo

4.1 Motivación: estimación de la media de una VA normal

Generando intervalos I

Figura 3: Inferencia sobre la media poblacional

(c) Pedro Femia bajo licencia

CC-BY-SA

Generando intervalos II

Si elegimos un nivel de probabilidad \(\small 1-\alpha\) para hacer un intervalo simétrico que contenga dicha probabilidad en la distribución normal estándar, este intervalo viene dado por los percentiles \(\small z_{\alpha/2}\) y \(\small z_{1-\alpha/2}\), de manera que se puede expresar

\[ \Pr\left(\,z_{\alpha/2}\,<\, z\, \le \, z_{1-\alpha/2} \right) = 1-\alpha \]

Asumiendo que \(\small \hat{\mu}=\bar{x}\) y haciendo la operación inversa a la tipificación para la distribución de la media muestral \(\small \mathcal{N}\left(\mu,\sigma/\sqrt{n} \right)\), este intervalo tendrá como límites

\[ \bar{x}+z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \quad\text{y} \quad \bar{x}+ z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}. \]

Figura 4: Intervalo centrado en la distribución teórica de la media muestral con una densidad de probabilidad de \(1-\alpha\)

(c) Pedro Femia bajo licencia

CC-BY-SA

Generando intervalos III

Recordemos que si fijamos un valor de \(\alpha\), por ejemplo al 5%, los cuantiles que dejan hacia la cola la mitad de esta área se obtienen en R como

qnorm(0.025)

[1] -1.959964

qnorm(0.975)

[1] 1.959964

Estos valores se suelen redondear a -1.96 y 1.96, respectivamente.

Cuidado con el signo: por simetría \(\small z_{0.975}=-z_{0.025}\), por lo tanto \(\small \bar{x}+z_{0.025}\,\frac{\sigma}{\sqrt{n}} \,\,=\,\,\bar{x}-1.96\,\frac{\sigma}{\sqrt{n}}\)

Figura 5: Intervalo centrado en la distribución teórica de la media muestral para el 95% de densidad de probabilidad central

(c) Pedro Femia bajo licencia

CC-BY-SA

El intervalo de confianza

Con todo lo anterior, llegamos a la expresión

\[ \Pr\left(\,\bar{x}+z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \,<\, \mu \le \, \bar{x}+ z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right) =1-\alpha \tag{1}\]

que es el intervalo de confianza, con nivel de confianza \((1-\alpha)\), para estimar la media de una variable aleatoria con distribución normal.

El nivel de confianza \(\small (1-\alpha)\) es la probabilidad de que el intervalo contenga realmente al parámetro poblacional desconocido \(\mu\).
\(\alpha\) es el error del intervalo y representa la probabilidad complementaria a la anterior: que el intervalo no contenga al parámetro poblacional.
El nivel de confianza, o equivalentemente, el nivel de error, son fijados de antemano por el investigador.
El nivel de confianza más habitual es del 95% (error del 5%). Como alternativas, suelen usarse el 90% (error del 10%) o el 99% (error del 1%).
La confianza nunca puede ser del 100% ¿por qué?

Con el nivel de confianza damos respuesta a la cuestión de qué incertidumbre tiene nuestra estimación.

Figura 6: Qué representa la confianza del intervalo: si repitieramos el muestreo (en las mismas condiciones) tandas de 100 veces, en promedio, \(\small (1-\alpha) \times 100\)
de cada \(\small 100\) intervalos contendrán al parámetro poblacional que se persigue estimar. El resto, por azar, no lo contendrán.
En la práctica, solo tenemos un intervalo, y esperamos que sea uno de los \(\small (1-\alpha) \times 100\) de cada \(\small 100\) buenos y no uno de los \(\small \alpha \times 100\) de cada \(\small 100\) malos.

(c) Pedro Femia bajo licencia

CC-BY-SA

Precisión del intervalo

El intervalo de la Ecuación 1 puede expresarse también como “centro \(\pm\) radio”:

\[ \bar{x}\pm z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \]

El radio del intervalo representa su precisión (\(\delta\)):

\[ \delta = z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \]

Figura 7: (A) el intervalo es simétrico respecto a la media. El radio \(\delta\) es su precisión
(B) ¿Cual de los dos intervalos es más preciso, el (8, 12), con \(\delta_1=2\), o el (7, 13) que tiene \(\delta_2=3\)?

(c) Pedro Femia bajo licencia

CC-BY-SA

Cuidado: El termino precisión alude a la “estrechez” del intervalo; una precisión grande quiere decir un valor de \(\delta\) pequeño:

intervalo más estrecho = \(\delta\) de menor magnitud = intervalo más preciso.

¿De qué depende la precisión?

Del nivel de confianza: si aumentamos \((1-\alpha)\), el valor de \(z_{1-\alpha/2}\) también aumenta, con lo que la precisión se reduce (el valor de \(\delta\) aumenta).
De la variabilidad de la variable estudiada: mayor variabilidad supone un valor de \(\sigma\) mayor, por lo tanto, a mayor variabilidad menor es la precisión (si \(\sigma\) aumenta, el valor de \(\delta\) también aumenta).
Del tamaño de muestra: Como \(n\) aparece en el denominador de \(\delta\), mayor tamaño muestral implica mayor precisión (\(\delta\) se reduce).

Con el nivel de precisión damos respuesta a la tercera cuestión que aborda la teoría de la estimación: permite aproximar el valor del parámetro poblacional, describir la incertidumbre asociada y valorar la precisión de la estimación.

4.2 Estimación por intervalo de la media de una variable aleatoria normal

Problema que surge con el intervalo basado en la distribución normal

El intervalo \[ \Pr\left(\,\bar{x}+z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \,<\, \mu \le \, \bar{x}+ z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right) =1-\alpha \]

desarrollado en la sección anterior presenta un problema: implica a \(\sigma\), un parámetro poblacional desconocido.

La solución natural es sustituir \(\sigma\) por su estimador muestral: \(s=\hat\sigma\)

Esto genera un nuevo inconveniente: William S. Gosset (1876-1937) observó que la incertidumbre adicional introducida al sustituir \(\sigma\) por su estimador puntual \(\large s\), provoca que la confianza real del intervalo sea menor al nivel \((1-\alpha)\) establecido. El efecto es tanto más acusado cuanto menor sea el tamaño muestral.

Para dar solución a este problema, Gosset desarrolló la distribución \(t\) de Student, que puede entenderse como una adaptación de la distribución normal cuando la varianza poblacional es desconocida (¡que es la situación más habitual en la práctica!) y en su lugar se utiliza la varianza muestral.

La distribución t de Student

Figura 8: Distribución \(t\) y distribución normal estándar

(c) Pedro Femia bajo licencia

CC-BY-SA

(A) La distribución \(t\) de Student tiene las colas mas pesadas que la distribución normal.
Esta distribución cambia en función de los grados de libertad de la muestra (que, de momento, son siempre gl=\(n-1\)). Conforme estos aumentan, la distribución \(t\) converge a la normal.
(B) El valor absoluto de un percentil \(t_\alpha\) siempre será mayor que el percentil \(z_\alpha\) de la normal estándar. Cuantos más grados de libertad se consideren, más se aproxima \(t_\alpha\) a \(z_\alpha\).

Cómo obtener los percentiles \(\small \alpha/2\,\) y \(\,\small 1-\alpha/2\) de la distribución \(t\) con \(\small n-1\) grados de libertad:

# Usamos como ejemplo alfa=0.05 y n=11:
alfa_medios <- 0.05 / 2
n <- 11 # <-- los g.l. serán n-1 = 10

qt(alfa_medios, n - 1) # <-- percentil alfa/2 de la distribución t con 10 gl

[1] -2.228139

qt(1 - alfa_medios, n - 1) # <-- percentil 1-(alfa/2) de la distribución t con 10 gl

[1] 2.228139

Estos serían los valores a considerar en un intervalo al 95% de confianza con una muestra de tamaño \(\small n=11\) en lugar de \(\small \pm 1.96\).

Intervalo de confianza para la media de una variable aleatoria normal

En la práctica, el intervalo con nivel de confianza \(\small (1-\alpha)\), para estimar la media de una variable normal se obtiene siempre como:

\[ \large \Pr\left(\,\bar{x}+t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \,<\, \mu \le \, \bar{x}+ t_{1-\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \right) =1-\alpha \tag{2}\]

siendo \(s=\hat\sigma\).

Este intervalo también se puede expresar como

\[ \large \Pr\left(\, \mu \in \bar{x} \pm\, t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \right) =1-\alpha \tag{3}\]

Observemos que la precisión viene dada por:

\[ \large \delta = t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \tag{4}\]

Ahora, el tamaño muestral afecta a la precisión en dos puntos: determinando el valor de \(t_{\alpha/2;\,n-1}\) y como denominador de \(\delta\).
En los dos casos contribuye de la misma forma: por un lado, divide a \(\delta\), por otro, cuanto mayor sea \(n\), menor será el valor de \(\small t_{\alpha/2;\,n-1}\) (más se aproxima al de la normal \(\small z_{\alpha/2}\)), por lo tanto

mayor tamaño muestral \(\Rightarrow\) mayor precisión ( = valor de \(\delta\) menor)

Aspectos prácticos

La validez del intervalo de confianza dado por la Ecuación 3 se basa en el supuesto de que la distribución de la media muestral es normal.

Ahora bien, una muestra proporciona una sola media. Con un único valor no podemos evaluar si su distribución es normal o no.

El teorema del límite central (TLC) establece que la distribución de la media muestral será normal si se cumple al menos una de estas condiciones:

La variable original sigue una distribución normal (esto sí se puede evaluar, porque tenemos \(n\) datos).
El tamaño muestral es grande (\(n\ge 60\)), incluso aunque la variable original no sea normal.

A partir de aquí, podemos concluir:

Muestras pequeñas (\(n<60\)): es necesario estudiar la normalidad de la variable original.
Si la variable es aproximadamente normal, entonces lo será también la media.
Muestras grandes (\(n \ge 60\)): el intervalo de la Ecuación 3 es, en principio, válido incluso sin normalidad de la variable.
Si la variable no es normal, el resultado es una aproximación que mejora conforme aumenta \(n\).

Tamaño de muestra

En la práctica, ante una estimación por intervalo, siempre debemos preguntarnos si es aceptable su precisión.

Ya hemos visto que la precisión depende de:

La variabilidad ← esto no lo podemos modificar.
El nivel de confianza establecido ← esto no lo debemos modificar.
El tamaño de muestra ← esto es lo que sí podemos y debemos modificar si queremos ganar precisión en la estimación.

Como la precisión del intervalo es

\[ \large \delta = t_{\alpha/2;\, n-1} \frac{s}{\sqrt{n}} \]

podemos establecer una precisión objetivo, \(\,\delta_{\text{objetivo}}\), y saber qué valor de \(n\) la proporciona. Despejando \(n\) de la expresión anterior:

\[ \large n = \left(\frac{t_{\alpha/2;\, n-1}\,\, s}{\delta_{\text{objetivo}}} \right)^2 \]

Si todavía no hemos tomado ninguna muestra, esta expresión presenta dos problemas:

¿Cuánto vale \(s\)? (la dispersión de la variable es desconocida)
¿Qué valor de la distribución \(t\) hay que considerar? ¿Con cuántos grados de libertad?

La conclusión es que para estimar el tamaño mínimo de muestra necesario para obtener un nivel de precisión \(\delta_{\text{objetivo}}\) al estimar una media \(\mu\) con un nivel de confianza de \((1-\alpha)\), es necesario disponer de una muestra piloto.

Una muestra piloto es un conjunto reducido de observaciones que se recoge antes del estudio principal, con el objetivo de anticipar problemas y estimar los parámetros necesarios para planificar correctamente el estudio final.

Con la información dada por la muestra piloto, ahora sí que podemos aproximar el tamaño mínimo de muestra necesario para cumplir con la precisión objetivo:

\[ \large n \ge \left(\frac{t_{\alpha/2;\, n_{\text{piloto}}-1}\,\, s_{\text{piloto}}}{\delta_{\text{objetivo}}} \right)^2 \tag{5}\]

Cuidado: el resultado de este cálculo es una variable aleatoria (implica a \(s=\hat\sigma\)), por tanto, puede ocurrir que al tomar una muestra del tamaño obtenido no se verifique la precisión objetivo.

Una vez tomada la muestra del tamaño estimado, hay que comprobar si la precisión obtenida es igual o mejor a la precisión objetivo, es decir, si se ha obtenido

\[ \delta_{\text{observado}} \le \delta_{\text{objetivo}}. \]

Si no ha ocurrido así, hay que recalcular la expresión de la Ecuación 5 con los nuevos valores de la muestra tomada.

¿Qué pasa si la variable es no es normal?

Recuerda:

el intervalo de confianza que hemos visto se basa en que la media tiene distribución normal.
No es la distribución de la variable la que interesa, es la distribución de su media.

Gracias al TLC, sabemos que la media tiene distribución normal si:

la variable tiene distribución normal, o bien
el tamaño de muestra es grande: \(\small n \ge 60\,\), aunque en en general, basta con que sea \(\small n \ge 30-40\,\,\) si la distribución no es muy asimétrica.

Si la distribución es muy asimétrica y el tamaño muestral no es grande, el intervalo basado en la normalidad no es fiable (su nivel de confianza real no es el que hemos establecido para construirlo).

Otras opciones de estimación:
(Lo siguiente queda fuera de los objetivos de este curso, se indica solo a título informativo)

Cuando la normalidad de la distribución de la media no es asumible, las alternativas son:

Uso de transformaciones para normalizar la variable.
Estimación bootstrap.
Uso de estimadores robustos de la media y de la varianza.

4.3 Estimación por intervalo de la proporción binomial

El problema de la estimación de la proporción binomial

La estimación de una proporción binomial es un problema clásico

Una distribución discreta es dificil de aproximar con precisión. Como la distribución binomial es discreta, no es posible obtener intervalos que cumplan exactamente con el nivel de confianza, \(\small (1-\alpha)\), utilizando métodos simples.
La estimación de la proporción es problemática cuando el tamaño muestral es pequeño o las proporciones son extremas (cerca de 0 o 1).

Por ello, históricamente han surgido distintos métodos. El objetivo es encontrar un equilibrio entre:

que el nivel de confianza real se ajuste al preestablecido para construir el intervalo;
que la precisión sea aceptable;
la robustez con tamaños de muestra pequeños
la facilidad de cálculo

Métodos de estimación

Método de Wald

Constituye el primer enfoque histórico.
Está basado en que la distribución de la proporción muestral, \(\small p\), se aproxima a la normal:

\[ \large p=\hat\pi, \qquad p \sim \mathcal{N} \left(\pi,\, \sqrt{\frac{\pi (1-\pi)}{n}} \right) \]

En la distribución se sutituye \(\small \pi\) por su estimador puntual \(\small p\), considerando entonces

\[ \large p \sim \mathcal{N} \left(p,\, \sqrt{\frac{p (1-p)}{n}} \right) \]

con lo que el intervalo, a nivel \(\small 1-\alpha\) se obtiene como

\[ \large p\,\pm\, z_{\alpha/2}\sqrt{\frac{p (1-p)}{n}} \]

Pero la sustitución de \(\small \pi\) por su estimador no siempre resulta adecuada. Cuando la muestra no es grande o si \(\small p\) es extrema

la varianza real queda mal estimada (generalmente infravalorada),
los intervalos son demasiado estrechos (incorrectamente precisos),
la confianza real es menor al \(\small 1-\alpha\) preestablecido.

En la práctica:

Es el método que sigue apareciendo en muchos textos.
La aproximación se considera válida si \(\small n\,p\) y \(\small n \, (1-p)\) son, los dos, mayores a 20.
Resulta muy fácil de calcular.
No usar. Hoy día constituye más una referencia histórica que un método recomendable.

Método de Wilson

Surge como corrección a las deficiencias del método de Wald.
Ajusta tanto el centro como la amplitud del intervalo.
La confianza suele ser real

La expresión del intervalo, para un nivel \(\small (1-\alpha)\) de confianza, es la siguiente:

\[ \frac{ \hat{p} + \frac{z_{\alpha/2}^{2}}{2n} }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \;\;\pm\;\; \frac{ z_{\alpha/2} \sqrt{ \frac{\hat{p}(1-\hat{p})}{n} + \frac{z_{\alpha/2}^{2}}{4n^{2}} } }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \]

Este intervalo es asimétrico respecto al estimador puntual.

En la práctica:

Es válido si \(\small n\,p\) y \(n \,(1-p)\) son mayores a 5.
Cuando se cumple lo anterior, combina la confianza real con una buena precisión.
Es el estandar recomendado.

Método de Agresti-Coull

Es una versión práctica del intervalo de Wilson.
Cuando el nivel de confianza es del 95%, este método se reduce a añadir 2 “éxitos” y 2 “fracasos” ficticios a la muestra:

\[ \tilde{n}=n+4,\qquad \tilde{p}=\frac{x+2}{n+4} \]

y después aplicar el método de Wald con \(\small \tilde{n}\) y \(\small \tilde{p}\):

\[ \tilde{p} \;\pm\; z_{\alpha/2} \sqrt{ \frac{ \tilde{p}(1-\tilde{p}) }{ \tilde{n} } }. \]

A título informativo, la expresióon general del intervalo, para un nivel \(\small (1-\alpha)\) de confianza, es la siguiente:

\[ \frac{ \hat{p} + \frac{z_{\alpha/2}^{2}}{2n} }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \;\;\pm\;\; \frac{ z_{\alpha/2} \sqrt{ \frac{\hat{p}(1-\hat{p})}{n} + \frac{z_{\alpha/2}^{2}}{4n^{2}} } }{ 1 + \frac{z_{\alpha/2}^{2}}{n} } \]

En la práctica:

Cuando el nivel de confianza es del 95% es muy sencillo de calcular
Combina la confianza real con una buena precisión
Es válido siempre (no tiene condiciones de validez, como el de Wilson).
Es la segunda mejor opción, después del método de Wilson.

Método de Clooper-Pearson

Basado en la distribución binomial. Se habla de que es un método “exacto”
Es el método más seguro, en el sentido de que cumple con el nivel de confianza prefijado,
También es el método más “conservador”: la confianza real suele ser mayor a la preestablecida.
Para cumplir con el nivel de confianza suele dar intervalos más anchos (poco precisos)
Es el más complicado de calcular

En la práctica:

Solo usar si se quiere garantizar que la confianza es \(\small (1-\alpha)\) o mayor.

Resumen de los métodos de estimación de la proporción

Método	Idea principal	Validez	Ventajas	Desventajas	Recomendación de uso
Wald (clásico)	Aproxima la distribución de la proporción a la normal.	\(\small n\,p\) y \(\small n (1-p) \ge 20\).	Muy simple de calcular.	La confianza real puede ser inferior a \(\small 1-\alpha\) Intervalos inestables cerca de 0 y 1.	Desaconsejado (salvo con \(\small n\) grande y proporciones equilibradas).
Wilson	Corrige el centro y la anchura del intervalo de Wald.	\(\small n\, p\) y \(\small n\,(1-p) \ge 5\).	Cumple con el nivel de confianza y son intervalos precisos.	Más complejo de explicar.	Es la mejor opción.
Agresti–Coull	Añade 2 éxitos y 2 fracasos antes de aplicar Wald.	Siempre.	Cumple con el nivel de confianza y es fácil de interpretar.	Ligeramente menos preciso que el de Wilson.	Muy recomendable (segunda mejor opción).
Clopper–Pearson (exacto)	Basado en la binomial (exacto).	Siempre.	Siempre cumple con el nivel de confianza exigido; matemáticamente riguroso.	Es conservador, da intervalos más amplios (menos precisos) de lo necesario.	Usar en situaciones que requieran la máxima seguridad.

Estimación del tamaño de muestra

La estimación del tamaño mínimo de muestra necesario para estimar una proporción, con una precisión \(\small \delta_\text{objetivo}\) y un nivel de confianza \(\small (1-\alpha)\), se hace a partir del enfoque de Wald \[ n \;\ge\; \frac{ z_{\alpha/2}^2 \, p\,(1-p) }{ \delta^2 } \]

El enfoque es el mismo que en el caso de la media: en lugar de \(\small t_{\alpha/2;\,n-1}\) se utiliza el percentil \(z_{\alpha/2}\) de la normal y la varianza ahora viene dada por \(p\,(1-p)\).
Observemos que ahora la precisión es una proporción.
El punto clave es qué valor de \(p\) considerar:
- Si no hay información previa (no hay una muestra piloto), se toma el valor de máxima incertidumbre: \(\small p = 0.5\).
  Este valor es el que maximiza la varianza: \(\small p\,(1-p)=0.25\), y esto da lugar a una fórmula exacta (siempre cumple).
- Si tenemos una muestra piloto, se toma el valor del intevalo de confianza más próximo a \(\small 0.5\).
  Por ejemplo:
  - si el intervalo obtenido es \(\small (0.30, 0,35)\), tomaríamos \(\small 0.35\), por estar más cerca de \(\small 0.5\).
  - si el intervalo fuera \(\small (0.45, 0.65)\) tomaríamos al \(\small 0.5\), que está contenido en él y es el valor que maximiza la varianza (en este caso, no hay diferencia con la situación de falta de información previa).

Poder estimar el tamaño mínimo de muestra sin muestra piloto no se puede hacer con otros parámetros:

Lo permite la estimación de la proporción por que existe un valor máximo para la varianza (\(\small 0.25\))
El problema es que el tamaño obtenido sin información puede ser demasiado grande, a veces imposible de tomar.
Si se dispone de muestra piloto y el intervalo obtenido a partir de ella no contiene a \(\small 0.5\), la estimación del tamaño de muestra da un valor menor, pero esta fórmula ya no es exacta, habrá que comprobar si se cumple, como se hace con la estimación del tamaño de muestra para la media;
Si el intervalo sí contiene a \(\small 0.5\), entonces la situación es la misma que cuando no hay información.

4.4 Estimación por intervalo del parámetro \(\small \lambda\) de la distribución de Poisson

Estimador e intervalo de confianza

El estimador puntual del parámetro es la media muestral:

\[ \hat\lambda = \bar{X} \]

Para obtener el intervalo de confianza, se pueden considerar dos métodos:

Método exacto
- Válido siempre
- Genera intervalos asimétricos
- Su nivel de confianza real esta siempre muy próximo al establecido para su elaboración.
- Es el método recomendable. No vemos aquí su expresión.

Método aproximado a la distribución normal. Supone que

\[ \hat\lambda = \bar{X}, \quad y\quad \bar{X}\sim \mathcal{N}\left(\lambda,\, \sqrt{\frac{\lambda}{n}} \right) \] de manera que el intervalo, con nivel de confianza \(\small (1-\alpha)\) se construye como

\[ \bar{X} \pm \, z_{\alpha/2}\,\sqrt{\frac{\bar X}{n}}. \]

Esta expresión es apropiada cuando el tamaño muestral es suficientemente grande y la media muestral no es muy pequeña.
En general, la aproximación es

razonable cuando \(\small n \, \hat \lambda \ge 20\)
muy buena cuando \(\small n \, \hat \lambda \ge 40\)

Cuando no se cumplen las condiciones anteriores, el nivel de confianza real puede ser inferior al prefijado.
Además, el desempeño del intervalo puede ser deficiente, con límites negativos.

Tamaño mínimo de muestra

Para determinar el tamaño de muestra necesario para que el intervalo de confianza para \(\small \lambda\) tenga una precisión objetivo \(\small \delta_{\text{objetivo}}\), es necesario disponer de una muestra piloto que permita hacer una estimación de la varianza (que en la Poisson es el propio \(\small\lambda\)).

A partir de esa estimación, se puede inferir el tamaño muestral como

\[ n \ge \frac{z_{\alpha/2}^2 \, \max \left(\hat \lambda\right) }{\delta_{\text{objetivo}}^2} \]

en donde \(\small \max \left(\hat \lambda\right)\) es el límite superior del intervalo de confianza obtenido a partir de la muestra piloto.

5 Referencias y lecturas recomendadas

Agresti, A., & Kateri, M. (2022). Foundations of Statistics for Data Scientists With R and Python (1st Ed.). Chapman & Hall/CRC Texts in Statistical Science.

Martín Andrés, A., & Luna del Castillo, J. de D. (2004). Bioestadística para las Ciencias de la Salud. Madrid: Norma.

Martín Andrés, A., & Luna del Castillo, J. de D. (2013). 40 ± 10 horas de Bioestadística. Madrid: Ed. Norma-Capitel.

Rosner, B. (2016). Fundamentals of Biostatistics (8.ª ed.). Boston: Brooks/Cole.

Enlaces:

Salud viral: Análisis crítico de contenidos de salud en redes sociales

Tema 4 Estimación

1 Introducción

2 Qué es la teoría de la estimación

3 Estimación puntual

4 Estimación por intervalo

4.1 Motivación: estimación de la media de una VA normal

4.2 Estimación por intervalo de la media de una variable aleatoria normal

4.3 Estimación por intervalo de la proporción binomial

4.4 Estimación por intervalo del parámetro \(\small \lambda\) de la distribución de Poisson

5 Referencias y lecturas recomendadas

6 Material de este proyecto

Tema 4
Estimación