Instalación de ggplot2
# Ejecutar solo si ggplot2 no está ya instalado
install.packages("ggplot2")Al finalizar esta sesión, el alumnado será capaz de:
Preparación de la sesión.
Instalación de los paquetes necesarios
Si has tenido problemas con la instalación, avisa al profesor o profesora responsable.
Otras opciones de instalación: web de BioestadisticaR2
A continuación se presenta un tipo de problema que es muy habitual en epidemiología descriptiva y analítica, y especialmente relevante en enfermería comunitaria y educación para la salud.
En un estudio transversal realizado en atención primaria, el personal de enfermería evalúa la adherencia al tratamiento antihipertensivo en pacientes adultos, según el nivel educativo. La adherencia se valora mediante una escala validada y se clasifica en tres categorías.
La información obtenida es la siguiente
| Nivel educativo | Baja | Media | Alta | Total |
|---|---|---|---|---|
| Sin estudios | 30 | 20 | 10 | 60 |
| Estudios primarios | 25 | 30 | 15 | 70 |
| Estudios secundarios | 15 | 30 | 25 | 70 |
| Estudios universitarios | 5 | 15 | 20 | 40 |
| Total | 75 | 95 | 70 | 240 |
tablarxc() de BioestadisticaR2 comentando su validez y las conclusiones que se derivan de este análisis. ¿Qué entiendes por frecuencias esperadas? Obtén la tabla con dichas frecuencias.Código para responder a los apartados 3 a 7:
library(BioestadisticaR2)
# Apartado 3 ----
## Generación de la tabla ----
### (a) declaración de las columnas ----
baja <- c(30, 25, 15, 5)
media <- c(20, 30, 30, 15)
alta <- c(10, 15, 25, 20)
### (b) Estructuración como data.frame----
datos <- data.frame(baja, media, alta)
### (c) Etiquetado de las filas ----
rownames(datos) <- c(
"Sin estudios",
"Estudios primarios",
"Estudios secundarios",
"Estudios universitarios"
)
### (d) visualización de la tabla creada ----
datos
## Realización del test de independencia ----
### con el código base de R ----
chisq.test(datos)
### con la función del paquete BioestadisticaR2 ----
tablarxc(frecs = datos)
## Frecuencias esperadas bajo la hipótesis nula ----
tablarxc(frecs = datos, tablas = "E")
# Apartado 4 ----
tablarxc(frecs = datos, tablas = "F")
# 0.50 (el 50%)
# Apartado 5 ----
tablarxc(frecs = datos, tablas = "C")
# 0.4 (el 40%)
# Apartado 6 ----
tablarxc(frecs = datos, tablas = "T")
# 0.125 (el 12.5%)
# Apartado 7 ----
tablarxc(frecs = datos, tablas = "S")Las causas de la significación se deducen del análisis de los residuos estandarizados \(\small r_{ij}^{*}\):
O alude a frecuencias observadas y E a las esperadas bajo la hipótesis nula.
La adherencia baja se da en el grupo de pacientes sin estudios. La adherencia alta la tienen, sobre todo, los pacientes con estudios universitarios.
Se ha realizado un estudio de cohortes prospectivo en un hospital comarcal. En él se incluyeron tres cohortes independientes de profesionales sanitarios, definidas en función de su estado vacunal frente a la gripe al inicio del estudio. En total participaron 300 profesionales sanitarios (enfermería y técnicos en cuidados auxiliares de enfermería, TCAE), todos ellos libres de infección respiratoria en el momento de la inclusión. Las cohortes estudiadas fueron:
Cada cohorte fue seguida de forma prospectiva durante 6 meses con el objetivo de evaluar la aparición de gripe estacional. La gravedad de la infección gripal durante el seguimiento se clasificó en las siguientes categorías:
Las frecuencias observadas en cada cohorte se resumen en la siguiente tabla de contingencia, que permite evaluar si la distribución de la gravedad de la gripe es homogénea entre las tres cohortes vacunales.
| Estado de vacunación | No gripe | Gripe leve | Gripe moderada | Gripe grave | Total |
|---|---|---|---|---|---|
| No vacunado | 40 | 25 | 20 | 15 | 100 |
| Vacunado (1 dosis) | 70 | 15 | 10 | 5 | 100 |
| Vacunado + refuerzo | 85 | 10 | 4 | 1 | 100 |
Código para responder a los apartados 2 a 5:
library(BioestadisticaR2)
# Apartado 2 ----
## Generación de la tabla de contingencia ----
No_gripe <- c(40, 70, 85)
Leve <- c(25, 15, 10)
Moderada <- c(20, 10, 4)
Grave <- c(15, 5, 1)
datos <- data.frame(No_gripe, Leve, Moderada, Grave)
rownames(datos) <- c("No_vacunado", "Vacunado_1dosis", "Vacunado_refuerzo")
## Visualización de la tabla ----
datos
## Prueba X-cuadrado ----
### con el código base de R ----
chisq.test(datos)
### con BioestadisticaR2 ----
tablarxc(frecs = datos)
# el test es válido, todas las frecuencias esperadas son > 5
# Apartado 3 ----
tablarxc(frecs = datos, tablas = "F")
# 0.4 (el 40% de los no vacunados, no han tenido gripe)
# Apartado 4 ----
tablarxc(frecs = datos, tablas = "C")
# 0.205 (el 20.5% de los casos sin gripe, no estaban vacunados)
# Apartado 5 ----
# residuos estandarizados
tablarxc(frecs = datos, tablas = "S")Las causas de la significación se deducen del análisis de los residuos estandarizados \(\small r_{ij}^{*}\):
La movilización precoz del paciente constituye una intervención clave para la prevención de complicaciones respiratorias, la reducción del riesgo de trombosis venosa y la disminución de la estancia hospitalaria. Se trata de una actuación directamente vinculada a los cuidados de enfermería, y el objetivo de este estudio es evaluar su efecto sobre la aparición de trombosis venosa profunda (TVP).
Para ello, se incluyeron 116 pacientes, que fueron asignados aleatoriamente a dos grupos: un grupo control (n = 56), que recibió los cuidados habituales, y un grupo de intervención (n = 60), en el que, además de los cuidados habituales, se aplicó un protocolo de movilización precoz. El seguimiento se realizó durante el periodo de hospitalización, registrándose la aparición o no de TVP. Durante dicho periodo, se observaron 5 casos de TVP en el grupo de intervención y 11 casos en el grupo control.
tabla2x2() del paquete BioestadisticaR2.Ten en cuenta que el formato de tabla que maneja esta función no es el habitual en Epidemiología. Para que la estimación de las medidas de asociación sea correcta, se debe poner la variable factor en columnas y la respuesta en filas.
library(BioestadisticaR2)
# grupo movilización
x1 <- 5 # <-- casos
n1 <- 60 # <-- tamaño muestral
# grupo control
x2 <- 11 # <-- casos
n2 <- 56 # <-- tamaño muestral
# Obtención de la tabla y medidas para un estudio prospectivo
tabla2x2(
c(
x1,
x2,
n1 - x1,
n2 - x2
),
fcat = c("TVP+", "TVP–"), # <-- Modalidades por filas
ccat = c("Movilización", "Control"), # <-- Modalidades por columnas
estudio = "P"
) # <-- estudio de tipo prospectivoEl test \(\small \chi^2\) es válido. Considerando \(\small \alpha=0.05\) no llega a ser significativo, pero hay indicios de siginficiación (\(\small p=0.078\)) que sugieren una probable falta de potencia. El test exacto de Fisher es un test conservador, pero también sugiere indicios de significación (\(\small p=0.106\)).
Riesgo relativo= 0.424 (<1) indica que la movilización se insinúa como factor protector: el riesgo de tener TPV se reduce más de la mitad con la movilización. Sin embargo, el intervalo de confianza para esta medida, \(\small 95\%\text{-}IC(RR)=(0.173, 1.155)\), contiene al valor nulo 1, reflejando así la falta de significación del test. Es un intervalo relativamente amplio (muy descentrado por la izquierda), lo que apoya la idea de que el estudio presenta falta de potencia.
Diferencia de riesgos = 0.113. Puntualmente, la movilización induce una reducción de un 11.3% en el riesgo de TPV. El intervalo de confianza \(\small 95\%\text{-}IC(DR)=(-0.238, 0.017)\) también presenta al valor nulo para esta medida, que ahora es 0. Lo que es coherente con la falta de significación del test. Sin embargo, la reducción puede llegar a ser de un 23%, lo que supone un efecto importante. Este resultado también invita a a ampliar el estudio con tamaños muestrales mayores a los actuales.
Odds ratio = 0.372; La fracción de casos que desarrolla TVP frente a los que no es 0.37 veces menor en el grupo con movilización que en el grupo control. De manera acorde a las medidas anteriores, el intervalo de confianza para la odds ratio contiene al valor nulo 1 y es relativamente amplio: \(\small 95\%\text{-}IC(OR)=(0.132, 1.165)\) reiterando la necesidad de ampliar el estudio.
# Obtención de la tabla y medidas para un estudio prospectivo
tabla2x2(
c(
x1,
x2,
n1 - x1,
n2 - x2
),
fcat = c("TVP+", "TVP–"), # <-- Modalidades por filas
ccat = c("Movilización", "Control"), # <-- Modalidades por columnas
estudio = "P", # <-- estudio de tipo prospectivo
tablas = "C"
) # <-- tabla de proporciones por columnasLos riesgos absolutos estiman la probabilidad de desarrollar TVP en cada grupo:
Sobre estos valores se puede ampliar la inferencia elaborando intervalos de confianza para una proporción, tal y como vimos en la práctica 5
Se investigó la posible asociación entre el consumo habitual de tabaco y la aparición de cáncer de pulmón en adultos de una determinada área sanitaria. El estudio incluyó 85 casos, correspondientes a pacientes diagnosticados de cáncer de pulmón, y 100 controles, definidos como personas sin dicho diagnóstico, emparejados por edad y sexo.
La exposición al tabaco se definió como haber fumado al menos un cigarrillo al día durante un período mínimo de 10 años. Los resultados mostraron que 72 de los casos habían estado expuestos al tabaco, mientras que dicha exposición se observó en 25 de los sujetos del grupo control.
Se trata de un estudio de casos y controles (retrospectivo). Hay dos muestras independientes, los pacientes diagnosticados con cáncer (los casos) y los sujetos sin ese diagnóstico (los controles). La hipótesis nula es la homogeneidad en las proporciones de casos y de controles expuestos al tabaco. La alternativa bilateral es que dichas proporciones no son iguales, aunque es más coherente plantear la alternativa unilateral “la exposición en los casos es mayor que en los controles”.
El código para elaborar la tabla de contingencia y la realización del contraste mediante la función tabla2x2() de BioestadisticaR2 se presenta a continuación. Recordemos que el formato de la tabla que maneja esta función no es el habitual en epidemiología. Se ha de colocar la respuesta por filas (casos en la primera fila) y el factor en columnas (fumadores en la primera columna).
En este tipo de estudio, cuando la prevalencia de la enfermedad es baja, la odds ratio se puede interpretar como una aproximación al riesgo relativo. La prevalencia a 5 años del cáncer de pulmón en España es, aproximadamente, del 0.08% de manera que la aproximación sería válida y podríamos decir que los fumadores tienen, aproximadamente, 16.6 veces más riesgo de desarrollar cáncer de pulmón que los no fumadores.
En un centro de salud se llevó a cabo un estudio con el objetivo de estimar la prevalencia de hipertensión arterial (HTA) y analizar su relación con la obesidad en la población adulta adscrita al centro.
En el estudio participaron 760 personas adultas, de las cuales se registró, para cada individuo, la presencia o ausencia de obesidad —definida como un índice de masa corporal (IMC) ≥ 30 kg/m²— y la presencia o ausencia de hipertensión arterial, determinada por diagnóstico previo o por cifras de tensión arterial iguales o superiores a 140/90 mmHg.
Del total de sujetos estudiados, 129 presentaban obesidad y 296 eran hipertensos, observándose que 77 individuos cumplían simultáneamente criterios de obesidad e hipertensión arterial.
library(BioestadisticaR2)
# Elaboración de la tabla
# Información del enunciado
n <- 760 # sujetos totales observados
c1 <- 129 # obesos
f1 <- 296 # hipertensos
x11 <- 77 # obesos e hipertensos
# Calculamos los totales marginales que faltan
c2 <- n - c1
f2 <- n - f1
# Calculamos el resto de frecuencias de la tabla
x12 <- f1 - x11
x21 <- c1 - x11
x22 <- f2 - x21
# Comprobamos que la tabla es correctoa y realizamos el test
tabla2x2(
c(x11, x12, x21, x22),
fcat = c("HT-Sí", "HT-No"),
ccat = c("Obesidad-Sí", "Obesidad-No"),
estudio = "T"
)El test \(\small \chi^2\) es válido. Su significación, \(\small p < 0.001\), pone de manifiesto la asociación entre las prevalencias de la obesidad y la hipertensión.
En los estudios transversales, la interpretación debe hacerse siempre en términos de prevalencia, y no en términos de riesgo (en este tipo de estudios, los riesgos no son calculables).
La razón de prevalencias, que la salida presenta como riesgo relativo, es 1.7, lo que quiere decir que la prevalencia de hipertensos en obesos es 1.7 veces mayor (casi el doble) que en sujetos no obesos. EL intervalo al 95% de confianza para esta medida (1.438, 2.049), refleja la significación del test (el intervalo no contiene al valor nulo 1). La precisión del intervalo es muy aceptable, lo que viene dado por el tamaño grande de la muestra analizada.
La diferencia de prevalencias, que en la salida aparece como diferencia de Berkson, es 0.250, cuya interpretación es que la prevalencia de hipertensos en obesos es un 25% mayor que en no obesos. De nuevo, el intervalo de confianza refleja la significación del test, ya que el valor nulo para esta medida, el 0, no está recogido en el intervalo.
La razón de producto cruzado u odds ratio, toma un valor similar a la proporción de riesgos. Indica que la fracción de hipertensos, frente a los que no lo son, es 2.786 veces mayor en sujetos obesos que en sujetos no obesos. Su intervalo no contiene al valor nulo 1. Podemos observar cómo la razón de producto cruzado aumenta de forma más rápida que la razón de prevalencias en la medida en que estos valores se alejan del valor nulo que representa la independencia entre las variables analizadas.
Un equipo de Epidemiología Hospitalaria se plantea evaluar la efectividad de una intervención educativa dirigida al personal de enfermería con el objetivo de mejorar la adherencia a la higiene de manos en una unidad de cuidados intensivos (UCI).
Para ello, se seleccionó aleatoriamente una muestra de 120 profesionales de enfermería. En cada participante se registró, mediante observación directa, si realizaba correctamente la higiene de manos antes del contacto con el paciente, tanto antes de la intervención formativa como tres meses después de su implementación.
Los resultados pusieron de manifiesto un éxito parcial de la intervención. De los 120 profesionales evaluados, 58 realizaban correctamente la higiene de manos tanto antes como después de la intervención, manteniendo una conducta adecuada a lo largo del estudio. Entre quienes no cumplían correctamente esta práctica en la evaluación inicial, 34 incorporaron una higiene de manos adecuada tras la formación. No obstante, 12 profesionales que presentaban una adherencia correcta al inicio dejaron de hacerlo en la evaluación realizada a los tres meses. Por último, 16 participantes mantuvieron de forma persistente una práctica incorrecta, tanto al inicio del estudio como tras la intervención.
La alternativa de interés es unilateral, en el sentido de que lo que interesa detectar es si el protocolo “aumenta” la proporción de sujetos que realizan correctamente la higiene manual.
Si definimos la tabla
contrastar las hipótesis \[ \begin{cases} \text{H}_0: & \pi_1 \ge \pi_2 \\ \text{H}_1: & \pi_1 < \pi_2 \end{cases} \qquad \]
es equivalente a contrastar
\[ \begin{cases} \text{H}_0: & \pi_{12} \ge \pi_{21} \\ \text{H}_1: & \pi_{12} < \pi_{21} \end{cases} \qquad \]
es decir, la alternativa de interés es que ha habido una reducción en la proporción de casos “pre-incorrecta/post-correcta” respecto a la proporción “pre-correcta/post-incorrecta”.
Como en todo test unilateral, hay que comprobar que la información muestral es compatible con la hipótesis alternativa.
El método a utilizar es el test de McNemar, cuya implementación la hace la función testmcnemar() del paquete BioestadisticaR2 (en R-base aparece la función mcnemar.test(), pero no proporciona tanta información como la primera).
En la tabla de proporciones totales podemos observar que \(\small \hat\pi_{12} = 0.100 < \hat\pi_{21}=0.283\), de manera que la información muestral es compatible con la hipótesis alternativa.
El test de McNemar es aplicable (cumple la condición de validez) y su resultado es significativo para \(\small \alpha=0.05,\) ya que es \(\small p<0.001\).
Para cada enunciado, se indica si es verdadero (V) o falso (F):
a. V; b. V; c. F; d. V; e. F; f. F; g. F; h. V; i. V; j. F; k. V; l. F; m. F; n V; o. F; p. F; q. V; r. V; s. V; t. V; u. V; v. F; w. V; x. V; y. F; z. V.
Identifica el tipo de estudio, formula las hipótesis adecuadas, realiza el contraste e interpreta sus resultados incluyendo las medidas de asociación apropiadas.
Identifica el tipo de estudio, formula las hipótesis adecuadas, realiza el contraste e interpreta sus resultados incluyendo las medidas de asociación apropiadas.
Identifica el tipo de estudio, formula las hipótesis adecuadas, realiza el contraste e interpreta sus resultados incluyendo las medidas de asociación apropiadas. Indica si este tipo de estudio permite estimar la prevalencia de las caídas en personas mayores.