Práctica 4

Autor/a

Objetivos de la práctica

Al finalizar esta sesión, el alumnado será capaz de:

  • Realizar cálculos básicos de probabilidad, interpretando correctamente los resultados en contextos clínicos.
  • Identificar variables aleatorias habituales en Ciencias de la Salud y reconocer la distribución teórica más adecuada (Binomial, Poisson, Normal, etc.) para modelizarlas.
  • Realizar muestreos aleatorios sobre poblaciones numeradas, incluyendo muestreo simple y muestreo en varias etapas.
  • Calcular probabilidades asociadas a las distribuciones Binomial, Poisson y Normal, y utilizarlas para responder preguntas clínicas realistas.
  • Relacionar sensibilidad, especificidad, falsos positivos y falsos negativos con probabilidades fácilmente interpretables.
  • Utilizar probabilidades para valorar la eficacia de métodos diagnósticos, la adherencia a protocolos de seguridad, la calidad asistencial o la fiabilidad de procedimientos.
  • Interpretar los resultados en lenguaje clínico, integrando la estadística con la toma de decisiones en Enfermería y Ciencias de la Salud.

  • Selecciona la carpeta de trabajo (usando el atajo ‘Ctrl’ + ‘Mayús’ + ‘H’, o la opción de menú ‘Session’, recuerda la conveniencia de que uses tu pen-drive).
  • Crea un nuevo script para realizar esta práctica
  • Pon como título a la práctica “Práctica 4” para que aparezca en el índice de RStudio
  • Guarda el script y recuerda volver a guardarlo de vez en cuando para actualizar el trabajo que vas haciendo.

Puedes contar con dos recursos de ayuda. Al pinchar en los enlaces siguientes, se abrirá una nueva pestaña en el navegador, no perderas la vista actual:


1 Cálculo básico de probabilidades

1.1

En una planta hospitalaria se observa que, entre los profesionales que acuden a una sesión de actualización:

  • El 62% utiliza mascarilla FFP2 en su práctica habitual.
  • El 41% utiliza pantalla facial en procedimientos de riesgo.
  • El 25% utiliza ambos dispositivos.

¿Cuál es la probabilidad de que un profesional utilice al menos uno de estos dos EPI?

Vamos a ponerle nombre a los sucesos:

  • \(A\) = “usar mascarilla FFP2”
  • \(B\) = “usar pantalla facial”
  • \(A \cap B\) = “usar mascarilla y pantalla”

Se pide \(\Pr(A \cup B)\). Como \(A\) y \(B\) son dos sucesos compatibles, la probabilidad de usar un método, o el otro, o ambos, se obtiene como

\[ \Pr(A \cup B) = \Pr(A)+\Pr(B)-\Pr(A \cap B) \]

Esto lo podemos calcular con R:

# Es buena práctica asignar los valores a objetos, en lugar
# de usarlos dierectamente en las operaciones (pero esto es opcional)
pA <- 0.62
pB <- 0.41
pAB <- 0.25

# la probabilidad pedida es:
pA + pB - pAB

# IMPORTANTE: ¿Por qué hay que restar pAB?
# Observa el resultado de pA+pB (sin la resta)
# ¿por qué ocurre esto?

1.2

La prevalencia del grupo sanguíneo A en la población española es del 46.0% mientras que la del grupo 0 es del 44.0%. Para un sujeto de esta población elegido al azar, responde a las siguientes cuestiones:

  1. ¿Puede ser “A y O” a la vez? ¿Cómo se denomina la relación que tienen este tipo de sucesos entre sí? ¿Cuánto vale la probabilidad asociada a ser “A y O”?
  2. ¿Cuál es la probabilidad de que el sujeto tenga grupo sanguíneo “de tipo A o de tipo O”?.
  3. ¿Y de que su grupo sanguíneo “no sea ni de tipo A ni de tipo O”?.
  4. La prevalencia del factor Rh+ es del 82% y la prevalencia del grupo A+ es del 37%. ¿Cuánto vale la probabilidad de tener grupo A o bien ser Rh+?
# 1. ser A y O, a la vez, son sucesos incompatibles,
# la probabilidad de su intersección es cero.

# Asignamos las probabilidades indicadas a sendos
# objetos para simplificar los cálculos
prob_A <- 0.46
prob_O <- 0.44

# 2.
prob_A + prob_O
# ¿por qué ahora no hay que restar nada?

# 3.
1 - (prob_A + prob_O)

# 4. definimos
prob_pos <- 0.82
prob_A_pos <- 0.37

# tener grupo A y Rh+ son sucesos compatibles, luego la prob.
# de que ocurra uno y otro viene dada por:
prob_A + prob_pos - prob_A_pos
# ¿por qué ahora sí que hay que restar prob_A_pos?
# ¿Qué valor se obtiene si no se resta? ¿sería un valor factible?

2 Variable aleatoria

2.1

En un centro de salud, el equipo de Enfermería Comunitaria va a realizar un programa de visitas domiciliarias para valorar: la adherencia a la medicación, el estado funcional, la situación social y las necesidades de cuidados en el hogar.

En la zona básica de salud hay 657 domicilios registrados como personas mayores de 75 años que viven en su domicilio. Por limitaciones de tiempo y de presupuesto, solo se pueden visitar 20 domicilios, que deben ser elegidos al azar. Los domicilios están numerados del 1 al 657 en una base de datos que está disponible en la dirección web “https://www.ugr.es/~pfemia/BSRLab/dat/zona_basica_salud.rds” .

  1. Define cuál es la población bajo estudio.
  2. ¿Qué requisitos tiene que cumplir la muestra elegida para que sea representativa de esa población? Si la muestra cumple los requisitos que indicas ¿recibe algún nombre concreto?
  3. Genera el listado de casos que constituirán la muestra de tamaño \(n=20\) utilizando la función sample() de R.
  4. ¿Cuál es la probabilidad de que un domicilio concreto (por ejemplo, el número 43) sea seleccionado en la muestra? ¿Conoces algún modelo de distribución de probabilidad que sea adecuado para caracterizar la variable aleatoria “nº de domicilio (entre 1 y 657)”?
  5. Una persona del equipo ha planteado que si en lugar de 20, se pudiese disponer de una muestra de 30, esta última sería más representativa ¿es correcto este planteamiento?
  6. Utilizando el enlace del enunciado, accede a la base de datos. El formato es el mismo que tenían las bases de datos de prácticas anteriores, “rds”, lo puedes leer con

    readRDS(url(pon aquí la dirección))

    y obtén los casos que constituyen la muestra aleatoria correspondiente al listado generado en el apartado 3 de este problema.
  1. Población objetivo = personas mayores a 75 años con domicilio en la demarcación de la zona básica de salud. Población marco = personas de estas características dadas de alta en el registro del centro de salud.

  2. Todo sujeto debe tener la misma probabilidad de pertenecer a la muestra y la pertenencia de uno es independiente de la del resto. Muestra aleatoria.

  3.  

# Definimos las variables de interés
N <- 657 # tamaño de la población
n <- 20 # tamaño muestral

# generamos un vector con valores 1 a N
domicilios <- 1:N

# Selección aleatoria de 20 domicilios
muestra_domicilios <- sample(domicilios, size = n)
# cada vez que ejecutemos la línea anterior, obtendremos
# una muestra aleatoria distinta.

# vemos el resultado. Los domicilios a visitar
# son los que tienen los siguientes números de
# identificación (ordenamos el listado):
sort(muestra_domicilios)
  1. La distribución es la uniforme. Todos los domicilios tienen la misma probabilidad, \(1/N\), de pertenecer a la muestra.
  2. No. La representatividad de la muestra la garantiza el método de elección (si es aleatoria, entonces es representativa). Un mayor tamaño lo que proporciona es más información (por ejemplo, para hacer estimaciones o tomar decisiones).
  3.  
# definimos la dirección del fichero de datos
url_datos <- "https://www.ugr.es/~pfemia/BSRLab/dat/zona_basica_salud.rds"

# importamos el archivo y asignamos el contenido a un data.frame que
# llamamos datos
datos <- readRDS(url(url_datos))

# vemos su cabecera
head(datos)

# vemos un resumen inicial
summary(datos)

# Vemos ahora los casos de la muestra que hemos generado:
# es un filtrado, en filas ponemos la muestra generada con sample()
# y el efecto es que se seleccionan sus índices.
# En columnas no ponemos nada y con ello estamos seleccionando
# a todas las columnas.
# Asignamos el resultado a un data.frame "muestra"
muestra <- datos[muestra_domicilios, ]

# vemos el contenido de "muestra"
muestra

summary(muestra)

2.2

En sujetos sanos (sin daño miocárdico), las moléculas de troponina-I presentes en una muestra de sangre son extremadamente escasas. En un volumen de 1 microlitro (µL) suelen aparecer, por término medio, 0.5 de estas moléculas.

  1. ¿Qué modelo de distribución de probabilidad crees que puede tener el número de moléculas de troponina-I por cada µL de sangre?
  2. ¿Cuál es la probabilidad de que una muestra de 1 µL no contenga ninguna molécula?
  3. Si se considera como señal de alerta sobre posible daño miocárdico un recuento de 3 o más moléculas/µL ¿cuál es la probabilidad de que un sujeto sano genere dicha alerta?
  4. A la vista del resultado anterior, ¿cree que un sujeto cuya muestra de sangre ha presentado 3 moléculas/µL debe ser examinado con urgencia en el servicio de cardiología?
# 1. La variable aleatoria X es el número de moléculas por microlitro
# cuya distribución será la de Poisson:   X -> P(0.5)

# 2.
dpois(0, 0.5)

# 3.
1 - ppois(2, 0.5)
# observa que en la función hemos puesto 2 y no 3
# porque ppois() nos da la probabilidad P(X<=x);
# no P(X<x).

# 4.
# Según el resultado anterior, en sujetos sanos, la probabilidad de detectar
# 3 o más moléculas por µL es solo del 1.4%.
# Esto significa que un valor de 3 es un valor relativamente extremo en la
# distribución de troponina en sujetos sin daño miocárdico.
# Por tanto, el hallazgo poco probable en sujetos sanos y
# justifica la urgencia por la revisión en cardiología.

2.3

Se emplea un test inmunocromatográfico para detectar calprotectina en heces, un biomarcador inflamatorio. El test funciona mediante tiras reactivas, cada una con una probabilidad del 85% de activarse correctamente cuando la muestra contiene suficiente biomarcador (esta es la sensibilidad de la tira). En cada análisis se utilizan 6 tiras independientes de la misma muestra para aumentar la fiabilidad.

Responde a las siguientes cuestiones:

  1. Interesa caracterizar el número de tiras que se activan en estos lotes de 6. Define cuál es la variable aleatoria implicada y su modelo de distribución de probabilidad.
  2. La clasificación del paciente es: “normal” si se activan hasta un máximo de tres tiras, y “patológico” si se activan más de tres. ¿Cuál es la probabilidad de que un paciente con biomarcador elevado, es decir con una probabilidad del 85% de activación por tira, obtenga un resultado negativo (“normal”)? (Este caso correspondería a un falso negativo)
  3. ¿Cuál será la probabilidad de que ese mismo paciente obtenga un resultado “patológico” (esta es la sensibilidad del método de diagnóstico)?
  4. Si las tiras reactivas se activan en ausencia de suficiente biomarcador el 1% de las veces, ¿cuál es la probabilidad de que un sujeto “normal” de un resultado patológico? (Este caso correspondería a un falso positivo).
  5. La especificidad del método diagnóstico es la probabilidad de que el test de resultado negativo (“normal”) cuando el sujeto está sano. Determina la especificidad de este test.
  6. Con la información previa ¿cuál es el valor esperado del número de tiras activadas en sujetos normales? ¿Y en sujetos patológicos? ¿Cómo se interpretan estos resultados?
  7. En el mercado existe otro modelo de tira reactiva, bastante más económico, que se activa el 75% de las veces cuando la muestra tiene suficiente biomarcador y el 15% de las veces cuando el nivel de biomarcador es muy bajo, como ocurre en un sujeto normal. Calcula la sensibilidad, la especificidad, la probabilidad de falsos positivos y la de falsos negativos para este nuevo modelo. Después, compara estos resultados con los obtenidos para el modelo anterior.
# 1. El número de tiras activadas en lotes de 6, cuando la probabilidad de
# activación es del 85%, es una VA discreta con distribución B(6,0.85)

# Vamos a definir los objetos que vamos a manejar para que sea más intuitivo
criterio <- 3 # criterio diagnóstico; Si X > criterio, el diagn. es "patológico"
n <- 6 # número de tiras
p_deteccion <- 0.85 # prob. de activación de cada tira en presencia de biomarcador

# 2. El paciente se diagnostica normal si X<=3, la probabilidad de este suceso es
p_falso_neg <- pbinom(criterio, n, p_deteccion) # hacemos el cálculo
p_falso_neg # consultamos su valor

# 3. Se pide P(X>3), esto es igual a 1-P(X<=3)
sensibilidad <- 1 - pbinom(criterio, n, p_deteccion) # hacemos el cálculo
sensibilidad # consultamos su valor

# 4. Para sujetos sanos X->B(6,0.01), tenemos que obtener la prob.
# de que de el test sea positivo por error. Definimos
p_error <- 0.01 # <-- definimos la prob. de falso positivo de la tira
p_falso_pos <- 1 - pbinom(criterio, n, p_error) # = 1-P(X<=3) = P(X>3)
p_falso_pos
# La probabilidad de que 4 tiras o más se activen por azar es casi nula,
# lo que justifica clínicamente el umbral de “patológico = 4 o más”.

# 5. Observa que la especificidad es 1-p_falso_pos
especificidad <- pbinom(criterio, n, p_error)
especificidad
1 - p_falso_pos

# 6. La esperanza matemática de la binomial es E(X)=np, por tanto:
# sujeto sano:
n * p_error
# un sujeto sano debería tener 0 tiras activas casi siempre, y
# ocasionalmente 1 (ruido), pero muy difícilmente 2 o más.

# sujeto patológico:
n * p_deteccion
# debería tener casi siempre, al menos 5 tiras activadas.

# 7. Ahora cambian las probabilidades:
p_deteccion2 <- 0.75
p_error2 <- 0.15

p_falso_neg2 <- pbinom(criterio, n, p_deteccion2)
p_falso_neg2 # 17%, antes era de menos del 5%

p_falso_pos2 <- 1 - pbinom(criterio, n, p_error2) # = 1-P(X<=3) = P(X>3)
p_falso_pos2 # antes era despreciable, ahora es de 0.6%

especificidad2 <- pbinom(criterio, n, p_error2)
especificidad2 # similar, 99.4% (la de antes era 99.99%)

sensibilidad2 <- 1 - pbinom(criterio, n, p_deteccion2)
sensibilidad2 # ha bajado del 95% al 83%

# las tiras más económicas tienen menos sensibilidad, es decir, mayor
# probabilidad de error al no detectar sujetos patológicos

2.4

El tiempo de protrombina (TP) es una prueba habitual para evaluar la vía extrínseca de la coagulación. En adultos sanos suele aproximarse razonablemente mediante una distribución normal. En un laboratorio se ha determinado que, en pacientes sin alteraciones, el tiempo de protrombina tiene distribución normal con media \(\mu = 12\) seg, \(\sigma = 1.1\) seg.

En el hospital, se considera que un TP mayor de 15 segundos es clínicamente anormal y puede indicar déficit de factores dependientes de vitamina K, hepatopatía, interacción con anticoagulantes orales o riesgo hemorrágico aumentado.

  1. Determina las siguientes probabilidades para el resultado de esta prueba con sujetos sanos:
    1. Probabilidad de tener un TP superior a 15 segundos
    2. Probabilidad de que se tenga un TP entre 11 y 13 segundos
  2. Determina los percentiles (cuantiles) 2.5 y 97.5 de la distribución. ¿Cuál es la probabilidad de que un sujeto santo tenga un TP comprendido entre estos dos valores?
  3. Se han seleccionado los resultados de cuatro pacientes que parecen ser inusualmente bajos, lo que podría ser síntoma de un proceso inflamatorio. Evalúa si estos resultados son simplemente bajos dentro de lo razonable o si, por el contrario, son anormalmente bajos (haz la valoración en la escala percentil y también en la escala tipificada):
    1. TP1 = 8.7 segundos
    2. TP2 = 10.6 segundos
    3. TP3 = 9.3 segundos
    4. TP4 = 11.7 segundos Da un diagnóstico para cada uno de los casos indicados
# Comenzamos definiendo los parámetros de la distribución:
mu <- 12
sigma <- 1.1

# 1.a
# Se pide determinar P(X > 15)
# esto será igual a 1-P(X <= 15)
1 - pnorm(15, mu, sigma)
# solo 3 de cada 1000 pacientes sanos tendrían un TP tan elevado

# 1.b
pnorm(13, mu, sigma) - pnorm(11, mu, sigma)
# El intervalo 11–13 segundos incluye cerca del 64% de la población sana,
# lo que representa la zona más típica y fisiológicamente esperable del TP.
# Observa que el intervalo (11, 13) viene a ser (mu-sigma, mu+sigma)

# 2.
qnorm(0.025, mu, sigma) # <-- percentil  2.5
qnorm(0.975, mu, sigma) # <-- percentil 97.5
# razona cuanto vale la probabilidad comprendida en este intervalo

# 3.a
x <- 8.7
# escala tipificada
z <- (x - mu) / sigma
z
# escala percentil
pnorm(x, mu, sigma)
# razona la información que aportan ambos valores
# ¿están indicando lo mismo?

# 3.b,c,d
# cambia el valor de x más arriba y repite el cálculo
# Si consideramos razonable al 95% central de la distribución
# y poco frecuente al 5% repartido en las dos colas, los casos a y c
# podrían ser patológicos; b y d son valores que entran dentro
# de lo esperable.

3 Ejercicios propuestos

Recuerda que debes intentar resolver los ejercicios sin mirar las soluciones, ¡de lo contrario no sirven para avanzar!

3.1 Análisis de eventos adversos

Un análisis de eventos adversos en el hospital informa que:

  • El 6% de las administraciones presenta error en la dosis.
  • El 4% presenta error en el horario.
  • El 1% presenta ambos errores simultáneamente.

Se pide:

  1. Formaliza los sucesos y sus probabilidades. Discute si son compatibles o no.
  2. ¿Cuál es la probabilidad de que una administración tenga al menos un tipo de error?
  3. ¿Cuál es la probabilidad de que una administración no tenga ningún error?

3.2 Control de calidad del material quirúrgico

En un bloque quirúrgico se observa que:

  • El 12% del material estéril presenta defectos en el embalaje.
  • El 5% del material está caducado.
  • El 3% está a la vez defectuoso y caducado.

Se pide: a. Formaliza los sucesos y sus probabilidades. ¿Cómo son, compatibles o incompatibles? b. ¿Cuál es la probabilidad de que un paquete sea defectuoso o esté caducado? c. ¿Cuál es la probabilidad de que sea defectuoso, pero no esté caducado?

Interpreta los resultados obtenidos.

3.3 Tiempo de coagulación

El tiempo de tromboplastina parcial activado (TTPa) evalúa la vía intrínseca de la coagulación y se usa, entre otras cosas, para monitorizar heparinas y detectar trastornos hemorrágicos. El TTPa de sujetos sanos se considera que es una variable con distribución \[ TTPa \sim \mathcal{N}\left(\mu = 30,\,\sigma = 4 \right) \]

En el diagnóstico, se considera que valores \(TTPa \ge 40 s\) como anormales y potencialmente indicativos de anticoagulación excesiva.

  1. ¿Cuál es la probabilidad de falso positivo, es decir, de que un sujeto sano tenga un TTPa ≥ 40 segundos?.
  2. ¿Cuál es la probabilidad de encontrar un TTPa entre 26 y 34 segundos?
  3. Determina la densidad de probabilidad contenida en el intervalo \(\mu \pm 1.96 \sigma\). Interpreta este resultado.
  4. ¿Cuáles son los cuartiles de la distribución? ¿Cómo se interpretan?

3.4 Punciones venosas

En una planta de hospitalización se registra que, en promedio, los profesionales de enfermería realizan 0,8 punciones venosas fallidas por turno de 8 horas. La dirección de calidad del hospital considera que tener 3 o más fallos en un turno supone un posible indicador de problema técnico, fatiga o material defectuoso. Se desea calcular algunas probabilidades, por ejemplo, la de que no haya ninguna punción fallida en un turno.

  1. Define la variable aleatoria y su modelo de distribución de probabilidad.
  2. Determina la probabilidad de que no haya ninguna función fallida en un turno.
  3. ¿Cuál es la probabilidad de que en un turno haya 3 o más punciones fallidas?
  4. ¿Cuál es la probabilidad de que en un turno haya 1 o 2 punciones fallidas?

3.5 Número de llamadas

En la planta de respiratorio de un hospital se ha registrado que los pacientes realizan, en promedio, 4 llamadas al timbre por hora para solicitar asistencia. La supervisión de enfermería considera que 8 o más llamadas en una hora puede indicar una carga asistencial excesiva y la necesidad de refuerzo de personal.

  1. Define la variable aleatoria implicada y su distribución de probabilidad
  2. ¿Cuál es la probabilidad de que en una hora se reciban solo 2 llamadas?
  3. ¿Cuál es la probabilidad de recibir 8 o más llamadas en una hora?
  4. ¿Se puede esperar que en una hora no se reciba ninguna llamada?

3.6 Checklist de Seguridad Quirúrgica de la OMS

En un quirófano se aplica la Checklist de Seguridad Quirúrgica de la OMS, dividido en tres momentos críticos:

  • Antes de la inducción anestésica (Sign In)
  • Antes de la incisión (Time Out)
  • Antes de la salida del quirófano (Sign Out)

Una auditoría interna revela que, en promedio, el equipo quirúrgico completa correctamente la checklist en cada intervención con una probabilidad del 93%. Un día están programadas 14 cirugías. El hospital considerará aceptable un cumplimiento de al menos 12 de las 14 cirugías.

  1. Si queremos saber la probabilidad de que el hospital considere aceptable el cumplimiento según el criterio indicado, ¿cuál es la variable aleatoria de interés y qué distribución tiene?.
  2. ¿Cuál es la probabilidad de que el equipo cumpla la checklist exactamente en 12 cirugías?
  3. ¿Cuál es la probabilidad de que el equipo NO alcance el umbral aceptable (es decir, cumpla 11 o menos)?
  4. ¿Cuál es la probabilidad de que el equipo SÍ supere el nivel de cumplimiento (es decir, cumpla 12 o más)?
  5. ¿Cuál es la probabilidad de que se complete la checklist en las 14 cirugías.

3.7 Auditoría interna

Un hospital quiere realizar una auditoría interna de la calidad del registro de Enfermería. Sin embargo, no se revisarán todas las historias clínicas: se usará un muestreo aleatorio en dos etapas.

En el hospital hay 6 plantas, cada una corresponde a una especialidad y tiene un número diferente de habitaciones, todas numeradas dentro de la planta correspondiente. La distribución de habitaciones por planta es como sigue:

planta 1 2 3 4 5 6
habitaciones 20 18 22 16 14 25

El objetivo es seleccionar:

  • Una planta al azar (todas tienen la misma probabilidad).
  • Una vez seleccionada la planta, elegir aleatoriamente 5 habitaciones de esa planta.

Este tipo de diseño se usa frecuentemente en auditorías reales porque es muy rápido, solo se revisa una planta, introduce aleatoriedad real y permite centrar esfuerzos en una sola unidad por cada ciclo de evaluación. En general se usa para auditorías, evaluación de cumplimiento de pronósticos de úlceras por presión, revisión de pautas de medicación, control de infecciones o supervisión de la calidad asistencial.

3.8 Ejercicio. Test PCR

La proteína C‑reactiva (PCR) es un biomarcador habitual de inflamación sistémica. En ausencia de infección o inflamación relevante, la PCR suele ser baja; sin embargo, cuando existe un proceso patológico –infeccioso o inflamatorio moderado–, tiende a elevarse de forma significativa.
Para estudiar la utilidad diagnóstica de la PCR, se propone el siguiente modelo simplificado:

  • En sujetos sanos, la concentración de PCR (mg/L) se distribuye aproximadamente como \[ \text{PCR}_\text{sano}\sim \mathcal{N}\left(\mu=2, sigma=0.8 \right) \]

  • en sujetos con inflamación o infección moderada

\[ \text{PCR}_\text{pat}\sim \mathcal{N}\left(\mu=8, sigma=2.5 \right) \]

Como criterio de diagnóstico se usa el punto de corte

\[ c=4\text{mg/L} \]

de manera que el test es positivo si \(\small \text{PCR}\ge 4\) y negativo en caso contrario.

Se pide:

  1. Probabilidad de que el test sea positivo en sujetos sanos (falsos positivos)
  2. Probabilidad de que el test de un resultado negativo en sujetos patológicos (falsos negativos)
  3. Probabilidad que el test sea positivo en sujetos patológicos (sensibilidad)
  4. Probabilidad de diagnosticar correctamente a un sano (especificidad)
  5. Determinar el criterio diagnóstico para que el test tenga un 1% de falsos positivos. Con este criterio, determinar la probabilidad de falsos negativos.

4 Soluciones a los ejercicios propuestos


4.1 Análisis de eventos adversos

a. Los sucesos son: \(A\) = error de dosis, \(B\) = error de horario, y \(A \cap B\) = ambos errores simultáneamente. \(A\) y \(B\) son sucesos compatibles. Hacemos los cálculos con R:

pA <- 0.06
pB <- 0.04
pAB <- 0.01

# b.
pA + pB - pAB
# Un 9% de las administraciones contiene errores;
# este valor es clínicamente relevante y orienta
# la necesidad de intervenciones de calidad.

# c.
1 - (pA + pB - pAB)

# El 91% de las administraciones se hace correctamente.


4.2 Control de calidad del material quirúrgico

a. Los sucesos son: \(A\) = ser defectuoso, \(B\) = estar caducado, \(A \cap B\) = ser defectuoso y estar caducado. Son sucesos compatibles, pueden ocurrir los dos a la vez.

pA <- 0.12
pB <- 0.05
pAB <- 0.03

# b. Se pide la probabilidad de la unión de A y B.
# Como A y B son compatibles:
pA + pB - pAB

# c. A la probabilidad de estar defectuoso hay que
# restarle la de estar defectuoso y caducado a la
# vez. La probabilidad pedida es:
pA - pAB

# Interpretación:
# El 14% del material no debería utilizarse en cirugía,
# y un 9% falla por defectos, no por caducidad.
# Esta información es clave para la gestión de almacén.


4.3 Tiempo de coagulación

mu <- 30
sigma <- 4

# a
1 - pnorm(40, mu, sigma)
# Un TTPa ≥ 40 segundos tiene una probabilidad menor del 1%
# en sujetos sanos, por lo que un valor así debe considerarse
# altamente sospechoso de alteración de la coagulación o
# exceso de anticoagulación.

# b
pnorm(34, mu, sigma) - pnorm(26, mu, sigma)
# El intervalo 26–34 s recoge aproximadamente el 68% de los
# valores posibles, lo que refleja el comportamiento típico
# de una variable biológica normal: la mayor parte de los
# sujetos se agrupan en torno a la media ± 1 DE

# c
m1 <- mu - 1.96 * sigma
m2 <- mu + 1.96 * sigma
pnorm(m2, mu, sigma) - pnorm(m1, mu, sigma)
# ¿qué conclusión sacas de este resultado? ¿"Quienes son" m1 y m2?

# d
qnorm(0.25, mu, sigma)
qnorm(0.75, mu, sigma)


4.4 Punciones venosas

a. La variable aleatoria es \(X =\) “número de funciones fallidas por turno” y tiene distribución de Poisson con parámetro \(\lambda = 0.8\): \[ X \sim \mathcal{P}\left(\ \lambda = 0.8 \right) \]

# comenzamos definiendo el valor del parámetro
lambda <- 0.8

# b
dpois(0, lambda)
#  es muy común que un turno no tenga ninguna punción
# fallida (esto ocurre en casi la mitad de los turnos)

# c: P(X>3) = 1 - P(X <= 2)
1 - ppois(2, lambda)
# la probabilidad de tener tres o más fallos en un turno
# no llega al 5% (en promedio, en menos de 5 de cada 100
# trunos se vería ese número de fallos)

# d. P(X=1 o X=2) = P(X=1) + P(X=2)  (son sucesos incompatibles)
dpois(1, lambda) + dpois(2, lambda)
# en la mitad de los turnos se observa un fallo o dos


4.5 Número de llamadas

a. El número de llamadas por hora es una variable aleatoria discreta con distribución de Poisson con parámetro \(\lambda=4\).

lambda <- 4

# b.
dpois(2, lambda)

# c.
1 - ppois(7, lambda)

# d.
dpois(0, lambda)
# en promedio, menos de 2 de cada 100 horas careceran de llamadas

# e.
ppois(6, lambda) - ppois(1, lambda)
# ¿por qué ponemos 1 y no 2 en la función de la derecha?
# observa que en este intervalo se acumula casi un 80%.
# Lo más probable es que cada hora se observen entre 2 y 6
# llamadas


4.6 Checklist de Seguridad Quirúrgica de la OMS

# a.  X = Nº de veces que se cumple el checklist en un conjunto de n=14 cirujías
# es una VA discreta con distribución Binomial(n=14, p=0.93)

# definimos los parámetros
n <- 14
p <- 0.93

# b.
dbinom(12, n, p)

# c.
pbinom(11, n, p)

# d.
1 - pbinom(11, n, p)

# e.
dbinom(14, n, p)
# se puede decir que completar el cheklist
# en todas las cirujías NO es un suceso raro


4.7 Auditoría interna

# 1. Definimos las plantas
plantas <- 1:6

# Número de habitaciones por planta
habitaciones_por_planta <- c(20, 18, 22, 16, 14, 25)

# 2. Seleccionamos una planta de manera aleatoria
planta_seleccionada <- sample(plantas, size = 1)

planta_seleccionada

# 3. Creamos las habitaciones de esa planta
habitaciones <- 1:habitaciones_por_planta[planta_seleccionada]

# 4. Seleccionamos 5 habitaciones al azar
muestra_habitaciones <- sample(habitaciones, size = 5, replace = FALSE)

muestra_habitaciones


4.8 Test PCR

# Parámetros del problema
mu_sano <- 2
sd_sano <- 0.8
mu_pat <- 8
sd_pat <- 2.5
punto_corte <- 4

# 1. Falsos positivos: P(X_sano >= c)
prob_fp <- 1 - pnorm(punto_corte, mean = mu_sano, sd = sd_sano)

# 2. Falsos negativos: P(X_pat < c)
prob_fn <- pnorm(punto_corte, mean = mu_pat, sd = sd_pat)

# 3. Sensibilidad: P(X_pat >= c) = 1 - FN
sensibilidad <- 1 - prob_fn

# 4. Especificidad: P(X-sano < c) = 1 - FP
especificidad <- 1 - prob_fp