22/mayo/2026
En general, cualquier estudio va a manejar grandes volúmenes de información.
La distribución de frecuencias de una variable indica qué valores o categorías puede tomar la variable y cómo se reparten en la muestra, especificando la frecuencia de cada uno.
Hay tres formas de resumir una distribución de frecuencias:
La métrica de la variable impone de qué manera se debe realizar cada modalidad de síntesis
| Grupo sanguíneo | \(n_i\) | % |
|---|---|---|
| A | 48 | 32% |
| B | 20 | 13% |
| AB | 6 | 4% |
| O | 76 | 51% |
Ejemplo: Distribución del grado de satisfacción del paciente con el servicio asistencial recibido.
| Satisfacción | \(n_i\) | % | \(N_i\) | % acumulado |
|---|---|---|---|---|
| Baja | 15 | 10% | 15 | 10% |
| Media | 40 | 27% | 55 | 37% |
| Alta | 60 | 40% | 115 | 77% |
| Muy alta | 35 | 23% | 150 | 100% |
Ejemplo: Frecuencia del número de caídas sufridas por los pacientes de una unidad geriátrica durante su ingreso.
| Caídas | \(n_i\) | % | \(N_i\) | % acum |
|---|---|---|---|---|
| 0 | 109 | 71.2% | 109 | 71.2% |
| 1 | 30 | 19.6% | 139 | 90.8% |
| 2 | 9 | 5.9% | 148 | 96.7% |
| 3 | 3 | 2.0% | 151 | 98.7% |
| ≥ 4 | 2 | 1.3% | 153 | 100% |
Ejemplo: Distribución del nivel de colesterol total
| Colesterol (mg/dL) | \(n_i\) | % | \(N_i\) | % acum |
|---|---|---|---|---|
| 120–159 | 10 | 6.7% | 10 | 6.7% |
| 160–199 | 50 | 33.3% | 60 | 40.0% |
| 200–239 | 60 | 40.0% | 120 | 80.0% |
| 240–279 | 25 | 16.7% | 145 | 96.7% |
| 280–319 | 5 | 3.3% | 150 | 100% |
| Colesterol (mg/dL) | \(n_i\) | % | \(N_i\) | % acum |
|---|---|---|---|---|
| < 160 | 10 | 6.7% | 10 | 6.7% |
| 160–199 | 50 | 33.3% | 60 | 40.0% |
| 200–239 | 60 | 40.0% | 120 | 80.0% |
| 240–279 | 25 | 16.7% | 145 | 96.7% |
| > 280 | 5 | 3.3% | 150 | 100% |

Evitar incluir diagramas de sectores en un informe siempre que sea posible.
En su lugar, son preferibles los diagramas de barras.
… El diagrama de barras
… El histograma
… El histograma
… Curva de densidad estimada (KDE) y función de distribución acumulada empírica (ECDF){#sec-KDE}
Preguntas que interesa responder de manera objetiva:
Topografiando las distribuciones: leyendo sus puntos clave.
CC-BY-ND
¿Cuál es el valor más frecuente?
Definición: La moda (\(\small Mo\)) es la categoría, o el valor, de la variable cuya frecuencia es mayor.
Ejemplo clínico: En un servicio hospitalario, el grupo sanguíneo más frecuente suele ser el O+. Identificar esta categoría modal es esencial para la planificación transfusional, la gestión del banco de sangre y la previsión de necesidades de hemoderivados.
Cálculo: En el lenguaje base de R no hay ninguna función que devuelva el valor de la moda.
¿Cuál es el punto que divide la muestra en dos mitades?
Definición: la mediana (\(\small Me\)) es el valor de la variable que divide a la muestra ordenada en dos partes iguales. Formalmente:
\[ Me=x_{\left(\frac{n+1}{2}\right)} \]
siendo \(\small x_{\left(j\right)}\) el valor de la variable que ocupa la posición \(\small j\) en la muestra ordenada (el paréntesis del subíndice indica “muestra ordenada”).
A la vista de una tabla de distribución de frecuencias, la mediana es el primer valor de la variable cuya frecuencia relativa acumulada es mayor o igual al 50% \((\small P_i \ge 0.5)\)
* Vemos más adelante los conceptos de robustez y de eficiencia.
Ejemplo: Los tiempos de espera en los servicios de urgencias presentan una distribución claramente asimétrica: muchos pacientes son atendidos en menos de una hora (mediana \(\approx\) 50 min), mientras que un grupo pequeño espera varias horas. Esta asimetría se debe a la variabilidad en la gravedad, picos de demanda, limitación de recursos, circuitos clínicos diferentes y pacientes pendientes de cama.
Cálculo: para el vector x: median(x) o quantile(x, 0.5)
¿Cuál es el valor promedio?
Definición: La media aritmética es el valor obtenido al sumar todos los valores de una variable y dividir el resultado por el número de sumandos:
\[\bar{x}=\frac{\sum{x_i}}{n}\]
Es la medida de posición central más relevante (la que más vamos a usar en inferencia).
El concepto de media es más general. Además de la media aritmética, hay otros tipos de media.
¿Cuándo representa mejor a la distribución?
Ventajas: es una medida muy intuitiva y manejable algebraicamente (gran parte de la inferencia estadística se hace basada en las medias).
Limitaciones:
Ejemplo: El nivel medio de la presión arterial sistólica en población adulta sana (sin patología cardiovascular) es de 120 mmHg.
Cálculo: para el vector x: mean(x).
¿Qué valor de la variable deja por debajo al \(p\,\)% de la distribución?
El cuantil \(\small p\), en donde \(\small p\) indica un porcentaje, es el valor de la variable que en la muestra ordenada acumula por debajo al \(p\,\)% de las observaciones, y deja por encima al \(\small (100-p)\,\)% restante:
\[ C_{p}=x_{\left((n+1)\times\frac{p}{100}\right)} \]
siendo \(\small x_{\left(j\right)}\) el valor de la variable que ocupa la posición \(\small j\) en la muestra ordenada (recordemos que el paréntesis del subíndice indica “muestra ordenada”)
A la vista de una tabla de distribución de frecuencias, el cuantil \(C_p\) es el primer valor de la variable cuya frecuencia relativa acumulada es \(\small P_i \left(\times 100\right) \ge p\,\)%
Cuándo se puede determinar:
Ventajas:
Limitaciones:
Hay ciertos cuantiles que reciben nombre propio: los percentiles, deciles, terciles,cuartiles y la mediana son todos cuantiles.
Ejemplo: Decir que, en una muestra, el cuantil 75 del nivel de colesterol es
\[ C_{75}=210 \,\,\text{mg/dL} \]
indica que el 75% de las observaciones tienen 210 mg/dL o menos, mientras que el 25% restante tienen 210 mg/dL o más.
Cálculo: para el vector x y una proporción p, el cuantil \(\small C_p\) se obtiene como: quantile(x, p)
¿Qué valores de la variable van acumulando un 1% de la distribución?
Los percentiles son los cuantiles \(\small C_1,\dots, C_{99}\). Hay un total de 99 percentiles: \(\small P_1,\dots, P_{99}\), que en conjunto dividen a la muestra en 100 partes, cada una con un 1% de las observaciones aproximadamente.
A la vista de una tabla de distribución de frecuencias, el percentil \(\small P_p\) es el primer valor de la variable cuya frecuencia relativa acumulada es \(\small P_i (\times 100)\ge p\,\)%
En Ciencias de la Salud es frecuente que se use el término percentil como sustituto de cuantil, pudiendo hablar así del percentil 2.5. Esto está ampliamente aceptado.
Observemos que \(\small Me=P_{50}\)
Ejemplo: Control de crecimiento infantil en consulta de Pediatría: Según las tablas de crecimiento infantil de la OMS, construidas con la información de miles de niños, un niño de 12 meses con un peso de 10.2 kg, se sitúa en el \(\small P_{75}\) de la distribución del peso de los niños con esta edad. Es decir, el 75% de los niños de 12 meses pesa 10.2 kg o menos. Esta información permiten localizar el peso de este niño en la distribución de referencia.
Cálculo: para el vector x, los percentiles son quantile(x, 0.01),…,quantile(x, 0.99)
¿Con qué criterio puedo dividir las observaciones en tres grupos del mismo tamaño?
Los terciles son los cuantiles \(\small T_1=C_{33.3}\) y \(\small T_2=C_{66.6}\). Los dos terciles permiten dividir a la muestra en tres grupos, cada uno con 1/3 de las observaciones.
Ejemplo: En la consulta de Enfermería de Atención Primaria se evalúa la adherencia de los pacientes al tratamiento antihipertensivo mediante la escala Morisky-Green. La distribución de la adherencia suele ser heterogénea, de modo que interesa clasificar a los pacientes en grupos de adherencia baja, intermedia y alta. Esto permite dirigir intervenciones educativas sobre el control tensional según las necesidades. Así, el tercil inferior recibe estrategias intensivas, el intermedio un refuerzo específico y el superior un plan de mantenimiento. La división por terciles se presenta así como un recurso práctico para adaptar la atención con un criterio basado en los datos.
Observación: en el ejemplo se habla de tercil inferior para aludir al primer grupo generado por la división hecha con el \(\small T_1\). Este uso del lenguaje es común y aceptado; formalmente los terciles son dos valores, los grupos que se generan cortando con estos dos valores son tres.
Cálculo: para un vector de datos x, los dos terciles son quantile(x, 0.333) y quantile(x, 0.666)
¿Con qué criterio puedo dividir las observaciones en cuatro grupos del mismo tamaño?
Los cuartiles son los cuantiles \(\small Q_1=C_{25}\), \(\small Q_2=C_{50}\) y \(\small Q_3=C_{75}\). Los tres cuartiles permiten dividir a la muestra en cuatro grupos, cada uno con 25% de las observaciones.
Ejemplo En una unidad de hospitalización se registra diariamente el nivel de dolor postoperatorio mediante una escala visual analógica (EVA) en los pacientes intervenidos de cirugía abdominal. Dado que los valores de dolor suelen presentar gran variabilidad y una distribución irregular, dividir la muestra en cuartiles permite identificar cuatro perfiles de pacientes según su intensidad de dolor. El primer cuartil agrupa al 25% de pacientes con dolor más bajo, mientras que el cuarto cuartil identifica al 25% con mayor dolor persistente, que pueden requerir revisión del plan analgésico, técnicas no farmacológicas adicionales o una valoración más estrecha. Esta clasificación en cuartiles facilita priorizar la intervención enfermera y ajustar los cuidados según la intensidad real del dolor.
Como ya pasó en el ejemplo de los terciles, en este también se habla de forma indistinta para aludir al cuartil como medida -es lo correcto- y a cada uno de los grupos que genera la división con los tres cuartiles. Aunque esta doble interpretación no es estrictamente correcta desde un punto de vista formal, es un uso habitual y ampliamente aceptado en la práctica.
En el ranking de impacto de las revistas científicas, se habla de revistas del primer cuartil para aludir a aquellas que ocupan el 25% de los primeros puestos respecto al orden del total de las revistas del área.
Cálculo: para el vector x, los tres cuartiles son quantile(x, 0.25), quantile(x, 0.50) y quantile(x, 0.75)
Hay más, como los quintiles (los cuatro valores que, conjuntamente, dividen a la distribución en 5 partes iguales), los deciles (los nueve valores que dividen a la distribución en 10 partes iguales), etc. Se pueden considerar todas las divisiones que resulten convenientes, en el fondo, todos son cuantiles

CC-BY-ND
5.2 Medidas de dispersión
¿En cuántas unidades (métricas) se reparte toda la distribución?
El rango, o amplitud, es la diferencia entre los valores máximo y mínimo de la distribución:
\[Rango = Máximo – Mínimo\]
Cálculo: para un vector x, el rango es rango <- max(x)-min(x)
¿Cuánto se alejan los datos de la posición central?

La varianza (\(s^2\)) es el promedio de las desviaciones – elevadas al cuadrado– de las observaciones respecto a la media aritmética:
\[ \displaystyle s^2= \frac{\sum{d_i^2}}{n-1} = \frac{\sum{\left(x_i-\bar{x}\right)^2}}{n-1} \]
Ejemplo: En el control de la presión arterial sistólica en pacientes con hipertensión, la varianza tiene una relevancia clínica directa. Dos tratamientos pueden lograr la misma media (por ejemplo, 130 mmHg), pero si uno presenta una varianza baja —con valores muy próximos a la media— y el otro una varianza alta —con oscilaciones amplias entre mediciones—, el primero refleja un control hemodinámico más estable y predecible que el segundo. Así, la varianza no solo cuantifica la dispersión estadística, sino que también mide la estabilidad clínica y el posible riesgo cardiovascular asociado a la variabilidad.
Cálculo: para un vector x, su varianza es var(x)
¿Cuánto se alejan los datos de un valor central, en las mismas unidades de la media?
La desviación típica (\(s\)) o desviación estándar es la raíz cuadrada de la varianza.
\[ \displaystyle s = \sqrt{\frac{\sum{\left(x_i-\bar{x}\right)^2}}{n-1}} \]
Ejemplo clínico: En el seguimiento de la presión arterial sistólica en pacientes con hipertensión, la desviación típica permite interpretar de forma directa la variabilidad clínica. Mientras que la varianza expresa la dispersión en unidades al cuadrado (mmHg²) y resulta útil desde el punto de vista matemático e inferencial, la desviación típica se expresa en las mismas unidades que la variable original (mmHg), lo que facilita su interpretación clínica.
Cálculo: para un vector x, su desviación estándar es sd(x)
Dadas dos distribuciones, ¿cuál presenta mayor variabilidad relativa respecto a su media?
El coeficiente de variación \(\small (CV)\) es la relación entre la desviación típica y la media. Habitualmente, su valor se multiplica por 100 y se expresa como porcentaje:
\[ \displaystyle CV= \frac{s}{\bar{x}}\,\,\left(\times100\%\right) \]
Ejemplo: En el control de la diabetes, el coeficiente de variación (CV)se utiliza para valorar la estabilidad de la glucemia a lo largo del día. No basta con conocer la media: un CV elevado indica que las cifras de glucosa oscilan demasiado en relación con su valor medio, lo que se asocia a mayor riesgo de hipoglucemias y descompensación metabólica. Por eso, en práctica clínica se considera que un CV glucémico superior al 36% refleja una variabilidad excesiva y la necesidad de revisar ajustes terapéuticos, los hábitos cotidianos o incidir en la educación diabetológica.
El coeficiente de variación es una medida muy útil cuando queremos valorar la precisión de un instrumento de medida. Mientras que la desviación típica dice cuánta variabilidad absoluta hay entre repeticiones de una medida, el CV expresa esa variabilidad en proporción al valor medio, lo que permite comparar la fiabilidad de aparatos distintos o que midan escalas diferentes.
Cálculo: no hay una función que proporcione el CV directamente. Para un vector x una función personalizada que devuelve el CV cuando es lícito su cálculo es:
¿En cuántas unidades se dispersa la mitad central de la distribución?
El rango intercuartílico \((\small RIQ)\) es la diferencia entre el tercer y el primer cuartil:
\[ \displaystyle RIQ = Q_3 – Q_1 \]
Ejemplo: En tiempos de estancia hospitalaria, un RIQ amplio indica diferencias marcadas en los días que permanecen los pacientes ingresados, incluso si la media no es extrema. Concretamente, si el primer cuartil es de 3 días y el tercer cuartil es de 11 días, el rango intercuartílico es de 8 días, lo que indica que el 50 % central de los pacientes permanece ingresado entre 3 y 11 días. Una diferencia de 8 días sugiere una elevada variabilidad clínica en la duración de las estancias hospitalarias.
Cálculo: para un vector x, su RIQ es IQR(x)
¿Hay más rangos de interés?
El Rango semi-intercuartílico (RSIQ), que se define como
\[ \displaystyle RSIQ=\frac{RIQ}{2} \]
Ejemplo: En una unidad de cirugía, los registros de dolor suelen mostrar valores muy extremos en algunos pacientes (picos en la escala EVA de 9–10), si el RSIQ=2, la mitad central de los pacientes se aparta, aproximadamente, \(\small \pm\) 2 puntos respecto del valor mediano. Esto permite valorar la estabilidad del control del dolor, comparar turnos o procedimientos y detectar cuándo la variabilidad aumenta sin que los valores atípicos distorsionen el análisis.
En la práctica, se pueden definir rangos a partir de cualquier pareja de cuantiles.
Por ejemplo los rangos P5-P95 \(\small =P_{95}-P_{5}\) o P10-P90 = \(\small P_{90}-P_{10}\) se han usado en el análisis de la función pulmonar (Roberts, 2010) y en estudios sobre neonatología y pediatría (Tao, 2025), respectivamente.
En un informe, las variables cuantitativas se resumen indicando una medida de posición y, al lado entre paréntesis, la de dispersión.
El uso de “±” en expresiones del tipo “media ± sd” está desaconsejado por la APA. En su lugar, es preferible “media (sd)”
Este es un ejemplo tipo International Journal of Nursing Studies o British Medical Journal
| Variable clínica | Resumen descriptivo |
|---|---|
| Edad (años) | 68.4 (14.7) |
| Estancia hospitalaria (días) | 6 (4–10) |
| Índice de comorbilidad de Charlson | 3 (2–5) |
| Número de diagnósticos al ingreso | 4.2 (1.9) |
| Número de procedimientos realizados | 2 (1–3) |
| Índice de dependencia funcional | 61.5 (22.3) |
Un estadístico es cualquier función obtenida a partir de los datos de una muestra y que resume alguna característica de esos datos.
La robustez es la resistencia de un estadístico frente a la presencia de valores extremos. Cuanto más robusto es un estadístico, menos se altera cuando aparecen datos anómalos.
La eficiencia es la capacidad de un estadístico para presentar poca variabilidad cuando repetimos el muestreo en las mismas condiciones. Un estadístico eficiente fluctúa muy poco entre muestras.
6.1 Variables cuantitativas: ¿qué usar la media o la mediana?
\[ -\sum_{x_i<\bar{x}}{\left(x_i-\bar{x}\right)} = \sum_{x_i>\bar{x}}{\left(x_i-\bar{x}\right)} \]
6.1 Variables cuantitativas: ¿qué usar la media o la mediana?
En distribuciones simétricas, la media es la medida de posición central más eficiente: utiliza mejor la información cuantitativa y varía menos entre muestras tomadas en las mismas condiciones y de la misma población.
En distribuciones asimétricas o con valores extremos, la mediana es más robusta y describe mejor el “centro” de la distribución, especialmente cuando el tamaño muestral es reducido, situación en la que la media resulta más sensible.
Sin embargo, cuando el tamaño muestral es grande, el impacto relativo de un valor extremo sobre la media disminuye y este estadístico se vuelve más estable. En inferencia vamos a usar preferentemente la media como medida de posición central.
La pareja “media (desviación típica)” (evitar el uso de la notación “media \(\pm\) desviación típica”) debe de ir siempre junta y es muy informativa cuando la distribución es simétrica.
Si la distribución es simétrica con forma de campana (más adelante llamaremos normal a una distribución con estas características), en el intervalo
\[ \left(\bar{x} - 2 \times s,\,\,\bar{x}+ 2 \times s\right) \]
se concentran, aproximadamente, el 95% central de las observaciones. Es decir, en estas condiciones
\[ P_{2.5} \approx \bar{x}-2 \times s\space\space\space \text{y} \space \space\space P_{97.5} \approx \bar{x}+2 \times s. \]

Cuando se utiliza como medida de posición central la mediana, la medida de dispersión que la acompaña es el RIQ o el RSIQ. Pero cuidado con su interpretación; si la distribución es asimétrica, la mediana no está a la misma distancia de cada cuartil.
| Situación clínica | Distribución | Medidas recomendadas: posición (dispersión) | Justificación de la medida de posición |
|---|---|---|---|
| Presión arterial en población sana | Aproximadamente normal | Media (desv. típica) | Representa bien el centro de la distribución |
| Tiempos de espera en urgencias | Muy asimétrica | Mediana (RIQ o RSI) | Evita la distorsión causada por esperas largas |
| Frecuencia cardiaca sin arritmias | Simétrica | Media (desv. típica) | Estabilidad fisiológica entre pacientes |
| Reconsultas en Atención Primaria | Cola larga por hiperfrecuentadores | Mediana (RIQ o RSI) | Robustez ante valores extremos |
| Glucemia en diabéticos controlados | Casi normal | Media (desv. típica) | Población homogénea |
| Temperatura corporal | Simétrica, sin valores extremos | Media (desv. típica) | Gran homogeneidad y baja variabilidad |
| Estancia hospitalaria | Cola larga | Mediana (RIQ o RSI) | Reduce el impacto de estancias muy prolongadas |
| EVA de dolor | Irregular, extremos frecuentes | Mediana (RIQ o RSI) | Mejor representación del valor típico |
Enlaces:
Bioestadística Aplicada a la Enfermería © 2026 por Pedro Femia, bajo licencia Creative Commons BY-NC-ND 4.0
.