# Es buena práctica asignar los valores a objetos, en lugar
# de usarlos dierectamente en las operaciones (pero esto es opcional)
pA <- 0.62
pB <- 0.41
pAB <- 0.25
# la probabilidad pedida es:
pA + pB - pAB
# IMPORTANTE: ¿Por qué hay que restar pAB?
# Observa el resultado de pA+pB (sin la resta)
# ¿por qué ocurre esto?Práctica 4
Objetivos de la práctica
Al finalizar esta sesión, el alumnado será capaz de:
- Realizar cálculos básicos de probabilidad, interpretando correctamente los resultados en contextos clínicos.
- Identificar variables aleatorias habituales en Ciencias de la Salud y reconocer la distribución teórica más adecuada (Binomial, Poisson, Normal, etc.) para modelizarlas.
- Realizar muestreos aleatorios sobre poblaciones numeradas, incluyendo muestreo simple y muestreo en varias etapas.
- Calcular probabilidades asociadas a las distribuciones Binomial, Poisson y Normal, y utilizarlas para responder preguntas clínicas realistas.
- Relacionar sensibilidad, especificidad, falsos positivos y falsos negativos con probabilidades fácilmente interpretables.
- Utilizar probabilidades para valorar la eficacia de métodos diagnósticos, la adherencia a protocolos de seguridad, la calidad asistencial o la fiabilidad de procedimientos.
- Interpretar los resultados en lenguaje clínico, integrando la estadística con la toma de decisiones en Enfermería y Ciencias de la Salud.
- Selecciona la carpeta de trabajo (usando el atajo ‘Ctrl’ + ‘Mayús’ + ‘H’, o la opción de menú ‘Session’, recuerda la conveniencia de que uses tu pen-drive).
- Crea un nuevo script para realizar esta práctica
- Pon como título a la práctica “Práctica 4” para que aparezca en el índice de RStudio
- Guarda el script y recuerda volver a guardarlo de vez en cuando para actualizar el trabajo que vas haciendo.
Puedes contar con dos recursos de ayuda. Al pinchar en los enlaces siguientes, se abrirá una nueva pestaña en el navegador, no perderas la vista actual:
- Puedes consultar el resumen del cálculo básico de probabilidades
También puedes acceder a la página con los cuadros resumen de funciones de R.
1 Cálculo básico de probabilidades
1.1
En una planta hospitalaria se observa que, entre los profesionales que acuden a una sesión de actualización:
- El 62% utiliza mascarilla FFP2 en su práctica habitual.
- El 41% utiliza pantalla facial en procedimientos de riesgo.
- El 25% utiliza ambos dispositivos.
¿Cuál es la probabilidad de que un profesional utilice al menos uno de estos dos EPI?
1.2
La prevalencia del grupo sanguíneo A en la población española es del 46.0% mientras que la del grupo 0 es del 44.0%. Para un sujeto de esta población elegido al azar, responde a las siguientes cuestiones:
- ¿Puede ser “A y O” a la vez? ¿Cómo se denomina la relación que tienen este tipo de sucesos entre sí? ¿Cuánto vale la probabilidad asociada a ser “A y O”?
- ¿Cuál es la probabilidad de que el sujeto tenga grupo sanguíneo “de tipo A o de tipo O”?.
- ¿Y de que su grupo sanguíneo “no sea ni de tipo A ni de tipo O”?.
- La prevalencia del factor Rh+ es del 82% y la prevalencia del grupo A+ es del 37%. ¿Cuánto vale la probabilidad de tener grupo A o bien ser Rh+?
2 Variable aleatoria
2.1
En un centro de salud, el equipo de Enfermería Comunitaria va a realizar un programa de visitas domiciliarias para valorar: la adherencia a la medicación, el estado funcional, la situación social y las necesidades de cuidados en el hogar.
En la zona básica de salud hay 657 domicilios registrados como personas mayores de 75 años que viven en su domicilio. Por limitaciones de tiempo y de presupuesto, solo se pueden visitar 20 domicilios, que deben ser elegidos al azar. Los domicilios están numerados del 1 al 657 en una base de datos que está disponible en la dirección web “https://www.ugr.es/~pfemia/BSRLab/dat/zona_basica_salud.rds” .
- Define cuál es la población bajo estudio.
- ¿Qué requisitos tiene que cumplir la muestra elegida para que sea representativa de esa población? Si la muestra cumple los requisitos que indicas ¿recibe algún nombre concreto?
- Genera el listado de casos que constituirán la muestra de tamaño \(n=20\) utilizando la función
sample()de R. - ¿Cuál es la probabilidad de que un domicilio concreto (por ejemplo, el número 43) sea seleccionado en la muestra? ¿Conoces algún modelo de distribución de probabilidad que sea adecuado para caracterizar la variable aleatoria “nº de domicilio (entre 1 y 657)”?
- Una persona del equipo ha planteado que si en lugar de 20, se pudiese disponer de una muestra de 30, esta última sería más representativa ¿es correcto este planteamiento?
- Utilizando el enlace del enunciado, accede a la base de datos. El formato es el mismo que tenían las bases de datos de prácticas anteriores, “rds”, lo puedes leer con
y obtén los casos que constituyen la muestra aleatoria correspondiente al listado generado en el apartado 3 de este problema.readRDS(url(pon aquí la dirección))
2.2
En sujetos sanos (sin daño miocárdico), las moléculas de troponina-I presentes en una muestra de sangre son extremadamente escasas. En un volumen de 1 microlitro (µL) suelen aparecer, por término medio, 0.5 de estas moléculas.
- ¿Qué modelo de distribución de probabilidad crees que puede tener el número de moléculas de troponina-I por cada µL de sangre?
- ¿Cuál es la probabilidad de que una muestra de 1 µL no contenga ninguna molécula?
- Si se considera como señal de alerta sobre posible daño miocárdico un recuento de 3 o más moléculas/µL ¿cuál es la probabilidad de que un sujeto sano genere dicha alerta?
- A la vista del resultado anterior, ¿cree que un sujeto cuya muestra de sangre ha presentado 3 moléculas/µL debe ser examinado con urgencia en el servicio de cardiología?
2.3
Se emplea un test inmunocromatográfico para detectar calprotectina en heces, un biomarcador inflamatorio. El test funciona mediante tiras reactivas, cada una con una probabilidad del 85% de activarse correctamente cuando la muestra contiene suficiente biomarcador (esta es la sensibilidad de la tira). En cada análisis se utilizan 6 tiras independientes de la misma muestra para aumentar la fiabilidad.
Responde a las siguientes cuestiones:
- Interesa caracterizar el número de tiras que se activan en estos lotes de 6. Define cuál es la variable aleatoria implicada y su modelo de distribución de probabilidad.
- La clasificación del paciente es: “normal” si se activan hasta un máximo de tres tiras, y “patológico” si se activan más de tres. ¿Cuál es la probabilidad de que un paciente con biomarcador elevado, es decir con una probabilidad del 85% de activación por tira, obtenga un resultado negativo (“normal”)? (Este caso correspondería a un falso negativo)
- ¿Cuál será la probabilidad de que ese mismo paciente obtenga un resultado “patológico” (esta es la sensibilidad del método de diagnóstico)?
- Si las tiras reactivas se activan en ausencia de suficiente biomarcador el 1% de las veces, ¿cuál es la probabilidad de que un sujeto “normal” de un resultado patológico? (Este caso correspondería a un falso positivo).
- La especificidad del método diagnóstico es la probabilidad de que el test de resultado negativo (“normal”) cuando el sujeto está sano. Determina la especificidad de este test.
- Con la información previa ¿cuál es el valor esperado del número de tiras activadas en sujetos normales? ¿Y en sujetos patológicos? ¿Cómo se interpretan estos resultados?
- En el mercado existe otro modelo de tira reactiva, bastante más económico, que se activa el 75% de las veces cuando la muestra tiene suficiente biomarcador y el 15% de las veces cuando el nivel de biomarcador es muy bajo, como ocurre en un sujeto normal. Calcula la sensibilidad, la especificidad, la probabilidad de falsos positivos y la de falsos negativos para este nuevo modelo. Después, compara estos resultados con los obtenidos para el modelo anterior.
2.4
El tiempo de protrombina (TP) es una prueba habitual para evaluar la vía extrínseca de la coagulación. En adultos sanos suele aproximarse razonablemente mediante una distribución normal. En un laboratorio se ha determinado que, en pacientes sin alteraciones, el tiempo de protrombina tiene distribución normal con media \(\mu = 12\) seg, \(\sigma = 1.1\) seg.
En el hospital, se considera que un TP mayor de 15 segundos es clínicamente anormal y puede indicar déficit de factores dependientes de vitamina K, hepatopatía, interacción con anticoagulantes orales o riesgo hemorrágico aumentado.
- Determina las siguientes probabilidades para el resultado de esta prueba con sujetos sanos:
- Probabilidad de tener un TP superior a 15 segundos
- Probabilidad de que se tenga un TP entre 11 y 13 segundos
- Determina los percentiles (cuantiles) 2.5 y 97.5 de la distribución. ¿Cuál es la probabilidad de que un sujeto santo tenga un TP comprendido entre estos dos valores?
- Se han seleccionado los resultados de cuatro pacientes que parecen ser inusualmente bajos, lo que podría ser síntoma de un proceso inflamatorio. Evalúa si estos resultados son simplemente bajos dentro de lo razonable o si, por el contrario, son anormalmente bajos (haz la valoración en la escala percentil y también en la escala tipificada):
- TP1 = 8.7 segundos
- TP2 = 10.6 segundos
- TP3 = 9.3 segundos
- TP4 = 11.7 segundos Da un diagnóstico para cada uno de los casos indicados
3 Ejercicios propuestos
Recuerda que debes intentar resolver los ejercicios sin mirar las soluciones, ¡de lo contrario no sirven para avanzar!
3.1 Análisis de eventos adversos
Un análisis de eventos adversos en el hospital informa que:
- El 6% de las administraciones presenta error en la dosis.
- El 4% presenta error en el horario.
- El 1% presenta ambos errores simultáneamente.
Se pide:
- Formaliza los sucesos y sus probabilidades. Discute si son compatibles o no.
- ¿Cuál es la probabilidad de que una administración tenga al menos un tipo de error?
- ¿Cuál es la probabilidad de que una administración no tenga ningún error?
3.2 Control de calidad del material quirúrgico
En un bloque quirúrgico se observa que:
- El 12% del material estéril presenta defectos en el embalaje.
- El 5% del material está caducado.
- El 3% está a la vez defectuoso y caducado.
Se pide: a. Formaliza los sucesos y sus probabilidades. ¿Cómo son, compatibles o incompatibles? b. ¿Cuál es la probabilidad de que un paquete sea defectuoso o esté caducado? c. ¿Cuál es la probabilidad de que sea defectuoso, pero no esté caducado?
Interpreta los resultados obtenidos.
3.3 Tiempo de coagulación
El tiempo de tromboplastina parcial activado (TTPa) evalúa la vía intrínseca de la coagulación y se usa, entre otras cosas, para monitorizar heparinas y detectar trastornos hemorrágicos. El TTPa de sujetos sanos se considera que es una variable con distribución \[ TTPa \sim \mathcal{N}\left(\mu = 30,\,\sigma = 4 \right) \]
En el diagnóstico, se considera que valores \(TTPa \ge 40 s\) como anormales y potencialmente indicativos de anticoagulación excesiva.
- ¿Cuál es la probabilidad de falso positivo, es decir, de que un sujeto sano tenga un TTPa ≥ 40 segundos?.
- ¿Cuál es la probabilidad de encontrar un TTPa entre 26 y 34 segundos?
- Determina la densidad de probabilidad contenida en el intervalo \(\mu \pm 1.96 \sigma\). Interpreta este resultado.
- ¿Cuáles son los cuartiles de la distribución? ¿Cómo se interpretan?
3.4 Punciones venosas
En una planta de hospitalización se registra que, en promedio, los profesionales de enfermería realizan 0,8 punciones venosas fallidas por turno de 8 horas. La dirección de calidad del hospital considera que tener 3 o más fallos en un turno supone un posible indicador de problema técnico, fatiga o material defectuoso. Se desea calcular algunas probabilidades, por ejemplo, la de que no haya ninguna punción fallida en un turno.
- Define la variable aleatoria y su modelo de distribución de probabilidad.
- Determina la probabilidad de que no haya ninguna función fallida en un turno.
- ¿Cuál es la probabilidad de que en un turno haya 3 o más punciones fallidas?
- ¿Cuál es la probabilidad de que en un turno haya 1 o 2 punciones fallidas?
3.5 Número de llamadas
En la planta de respiratorio de un hospital se ha registrado que los pacientes realizan, en promedio, 4 llamadas al timbre por hora para solicitar asistencia. La supervisión de enfermería considera que 8 o más llamadas en una hora puede indicar una carga asistencial excesiva y la necesidad de refuerzo de personal.
- Define la variable aleatoria implicada y su distribución de probabilidad
- ¿Cuál es la probabilidad de que en una hora se reciban solo 2 llamadas?
- ¿Cuál es la probabilidad de recibir 8 o más llamadas en una hora?
- ¿Se puede esperar que en una hora no se reciba ninguna llamada?
3.6 Checklist de Seguridad Quirúrgica de la OMS
En un quirófano se aplica la Checklist de Seguridad Quirúrgica de la OMS, dividido en tres momentos críticos:
- Antes de la inducción anestésica (Sign In)
- Antes de la incisión (Time Out)
- Antes de la salida del quirófano (Sign Out)
Una auditoría interna revela que, en promedio, el equipo quirúrgico completa correctamente la checklist en cada intervención con una probabilidad del 93%. Un día están programadas 14 cirugías. El hospital considerará aceptable un cumplimiento de al menos 12 de las 14 cirugías.
- Si queremos saber la probabilidad de que el hospital considere aceptable el cumplimiento según el criterio indicado, ¿cuál es la variable aleatoria de interés y qué distribución tiene?.
- ¿Cuál es la probabilidad de que el equipo cumpla la checklist exactamente en 12 cirugías?
- ¿Cuál es la probabilidad de que el equipo NO alcance el umbral aceptable (es decir, cumpla 11 o menos)?
- ¿Cuál es la probabilidad de que el equipo SÍ supere el nivel de cumplimiento (es decir, cumpla 12 o más)?
- ¿Cuál es la probabilidad de que se complete la checklist en las 14 cirugías.
3.7 Auditoría interna
Un hospital quiere realizar una auditoría interna de la calidad del registro de Enfermería. Sin embargo, no se revisarán todas las historias clínicas: se usará un muestreo aleatorio en dos etapas.
En el hospital hay 6 plantas, cada una corresponde a una especialidad y tiene un número diferente de habitaciones, todas numeradas dentro de la planta correspondiente. La distribución de habitaciones por planta es como sigue:
| planta | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| habitaciones | 20 | 18 | 22 | 16 | 14 | 25 |
El objetivo es seleccionar:
- Una planta al azar (todas tienen la misma probabilidad).
- Una vez seleccionada la planta, elegir aleatoriamente 5 habitaciones de esa planta.
Este tipo de diseño se usa frecuentemente en auditorías reales porque es muy rápido, solo se revisa una planta, introduce aleatoriedad real y permite centrar esfuerzos en una sola unidad por cada ciclo de evaluación. En general se usa para auditorías, evaluación de cumplimiento de pronósticos de úlceras por presión, revisión de pautas de medicación, control de infecciones o supervisión de la calidad asistencial.
3.8 Ejercicio. Test PCR
La proteína C‑reactiva (PCR) es un biomarcador habitual de inflamación sistémica. En ausencia de infección o inflamación relevante, la PCR suele ser baja; sin embargo, cuando existe un proceso patológico –infeccioso o inflamatorio moderado–, tiende a elevarse de forma significativa.
Para estudiar la utilidad diagnóstica de la PCR, se propone el siguiente modelo simplificado:
En sujetos sanos, la concentración de PCR (mg/L) se distribuye aproximadamente como \[ \text{PCR}_\text{sano}\sim \mathcal{N}\left(\mu=2, sigma=0.8 \right) \]
en sujetos con inflamación o infección moderada
\[ \text{PCR}_\text{pat}\sim \mathcal{N}\left(\mu=8, sigma=2.5 \right) \]
Como criterio de diagnóstico se usa el punto de corte
\[ c=4\text{mg/L} \]
de manera que el test es positivo si \(\small \text{PCR}\ge 4\) y negativo en caso contrario.
Se pide:
- Probabilidad de que el test sea positivo en sujetos sanos (falsos positivos)
- Probabilidad de que el test de un resultado negativo en sujetos patológicos (falsos negativos)
- Probabilidad que el test sea positivo en sujetos patológicos (sensibilidad)
- Probabilidad de diagnosticar correctamente a un sano (especificidad)
- Determinar el criterio diagnóstico para que el test tenga un 1% de falsos positivos. Con este criterio, determinar la probabilidad de falsos negativos.