Tema 8
Análisis de datos cualitativos

Pedro Femia

22/mayo/2026

1 Introducción

\(\tiny \blacksquare \,\,\) En el ámbito de la enfermería, los datos categóricos aparecen de forma natural en múltiples situaciones:

  • Resultados clínicos dicotómicos: curación/no curación, presencia/ausencia de infección, aparición/no de úlceras por presión.
  • Variables nominales: tipo de intervención, turno de trabajo (mañana/tarde/noche), adherencia al tratamiento (sí/no).
  • Clasificaciones ordinales: estadios de una herida, grados de dependencia, escalas de dolor categorizadas (leve, moderado, intenso).

Gran parte de las decisiones en Enfermería se basan en clasificaciones, presencias/ausencias y niveles:

  • ¿Hay asociación entre el uso de dispositivos invasivos y la presencia de infección?
  • La proporción de pacientes con infección ¿difiere entre varias unidades hospitalarias?
  • ¿Existe relación entre el tipo de cuidado de enfermería y la aparición de complicaciones?


Procedimiento de análisis

  • La forma de analizar variables cualitativas es a través de las frecuencias con que se presenta cada una de sus modalidades
  • Las frecuencias se deberán estandarizar en forma de proporciones
  • La inferencia consistirá en comprobar si las proporciones observadas (información empírica) difieren de forma significativa de las proporciones esperadas suponiendo una determinada hipótesis.
  • Al intervenir dos variables, la síntesis de las frecuencias observadas debe hacerse en forma de tabla de contingencia

1.1 Tablas de contingencia (de dos vías)

Una tabla de contingencia de dos vías es una matriz que resume la distribución conjunta de dos variables cualitativas, organizando los datos en filas y columnas. A este tipo de tablas también se alude como tablas de clasificación cruzada.

  • El número de vías alude al número de variables cualitativas que se presentan simultáneamente en la tabla (aquí solo consideramos el caso de dos).
  • La tabla de contingencia constituye el formato de presentación de los datos que permite analizar la posible relación entre ambas variables.
  • Cada celda de la tabla contiene la frecuencia de las observaciones que pertenecen simultáneamente a una categoría de la primera variable y a una categoría de la segunda.
  • Se alude a las tablas de contingencia por sus dimensiones: “número de filas” \(\times\) “número de columnas”. Las tablas más pequeñas son las tablas 2x2, que constituyen un caso particular de especial interés.
  • En general, se presentan las tablas mostrando los totales de filas y de columnas.
  • Estos son dos ejemplos cuyo análisis desarrollaremos a lo largo del tema

Figura 1: Dos tablas de contingencia correspondientes a estudios observacionales transversales



1.1 Tablas de contingencia (de dos vías)

Notación
Figura 2: Tabla de contingencia r x c con las frecuencias (absolutas) observadas.
Los totales \(\small \lbrace F_1,\dots,F_r \rbrace\) y \(\small \lbrace C_1,\dots,C_c \rbrace\) constituyen las distribuciones marginales de las variables \(\small A\) y \(\small B\) respectivamente.
En muchos textos se utiliza la notación \(\small n_{ij}\), \(\small n_{i \dotplus}\) y \(\small n_{\dotplus j}\) para aludir a \(\small O_{ij}\), \(\small F_{i}\) y \(\small C_{j}\) respectivamente.

Proporciones observadas
Figura 3: Hay tres tipos de tablas de proporciones que surgen al estandarizar las frecuencias absolutas observadas según tres criterios alternativos.
La tabla 1, de proporciones por filas, y la tabla 2, de proporciones por columnas, representan las distribuciones condicionadas. La tabla 3 es la distribución conjunta, cuyos totales representan las distribuciones marginales de cada variable.
En todos los casos, si las proporciones se multiplican por 100 se obtiene la correspondiente tabla de porcentajes.



Ejemplo
Figura 4: Úlceras por presión (UPP) en tres muestras independientes correspondientes a tres unidades asistenciales (UA).
Tabla de frecuencias observadas y las tres estandarizaciones posibles de estas frecuencias.
¿Cómo se interpreta un cruce concreto de categorías en cada estandarización?
Figura 5




2 El test \(\small \chi^2\)

\(\tiny \blacksquare \,\,\) El test \(\small \chi^2\) es una herramienta fundamental en el análisis de datos cualitativos.
Permite evaluar si las frecuencias observadas son compatibles con las frecuencias esperadas bajo una hipótesis concreta.


2.1 Contextos e hipótesis

La Genética Mendeliana

Gregor Mendel (1822-1884) estudió cómo se transmiten los caracteres hereditarios utilizando plantas de guisante. A diferencia de otros investigadores de su época, Mendel no se limitó a describir los fenómenos, sino que contó, clasificó y comparó resultados, introduciendo una forma cuantitativa de hacer ciencia.

A partir de sus experimentos formuló predicciones teóricas sobre cómo deberían repartirse los caracteres (por ejemplo, el tipo o el color de la piel de la semilla) y las contrastó con los datos observados.

  • Considerando el tipo de piel, Mendel cruzó plantas heterozigóticas para los caracteres piel lisa (carácter dominante) y piel rugosa (carácter recesivo).
  • Según sus hipótesis, la siguiente generación de plantas debería presentar una proporción de 3:1 de semillas con piel lisa frente a semillas con piel rugosa.
  • Al observar un total de 800 semillas de dicha generación, 610 (76.2%) tenían la piel lisa y 190 (23.7%) la piel rugosa Estas son las frecuencias observadas
  • La teoría mendeliana predice que, de las 800 semillas, 600 (= 800 × 0.75) deberían tener la piel lisa y las 200 restantes, la piel rugosa Estas son las frecuencias esperadas según las hipótesis de Mendel.
  • La cuestión a resolver es si las frecuencias observadas son compatibles con las hipótesis teóricas de Mendel.

Esta comparación entre lo que la teoría predice y lo que realmente se observa es la base conceptual de pruebas estadísticas como el test \(\small \chi^2\).



Contextos de aplicación del χ²

El test \(\small \chi^2\) es una prueba estadística no paramétrica utilizada para analizar variables cualitativas.

  • Su objetivo es contrastar si la discrepancia entre las frecuencias observadas en una tabla de contingencia y las esperadas bajo una hipótesis pueden atribuirse al azar o, pot el contrario, son suficientemente grandes como para concluir que los datos no sustentan dicha hipótesis.
  • Según el tipo de muestreo, el test \(\small \chi^2\) permite analizar la discrepancia entre las frecuencias observadas y las esperadas en dos contextos distintos:
    • Como prueba de homogeneidad, cuando se comparan las distribuciones de una variable cualitativa en dos o más muestras independientes, con el fin de evaluar si dichas distribuciones pueden considerarse homogéneas.
      → La hipótesis nula es “todas las distribuciones son homogéneas
    • Como prueba de independencia, cuando se analizan dos variables cualitativas observadas en una sola muestra, con el objetivo de inferir si existe independencia o asociación entre ellas.
      → La hipótesis nula es “las dos variables son independientes
La diferencia entre homogeneidad e independencia radica en cómo se han obtenido los datos.
Desde el punto de vista estadístico, la homogeneidad entre muestras se traduce en la independencia entre las variables en la tabla de contingencia.


Aspecto Homogeneidad Independencia
Nº de muestras Dos o más muestras independientes Una sola muestra
Variables en la tabla Grupo / muestra +
Variable cualitativa común
Dos variables cualitativas
Pregunta principal ¿La distribución de la variable es la misma en todos los grupos? ¿Existe asociación entre las dos variables?
Hipótesis nula (H₀) Las proporciones son iguales en todas las muestras Las variables son independientes
Interpretación Comparación de distribuciones entre grupos Relación entre variables
Estadístico utilizado
El método es el mismo en los dos contextos
χ² χ²


El test χ² se utiliza en muchos más contextos que los dos que se abordan en este tema.
Por ejemplo, puede emplearse para contrastar el ajuste de unas frecuencias observadas a una distribución teórica, como ocurre en los clásicos experimentos de Mendel. El primer test de normalidad, propuesto por Karl Pearson, pertenece a esta familia de contrastes. Existen, además, muchas otras situaciones en la estadística inferencial en las que el test χ² resulta aplicable.



\(\tiny \blacksquare \,\,\) Los dos contextos que abordamos en este tema, homogeneidad e independencia, son conceptualmente distintos, pero el test χ² se aplica de la misma forma en ambos casos. Por este motivo, primero describimos cada situación y después desarrollamos el estadístico de contraste de manera común.

Contraste de homogeneidad

\(\tiny \blacksquare \,\,\) Lo desarrollamos con el ejemplo de la tabla 1 del Figura 1 presentada al inicio de este tema

  • Pregunta clínica: ¿Es comparable la proporción de UPP entre distintas unidades asistenciales?
  • Parámetros a contrastar:

\[ \large \pi_i= \small \Pr(\text{UPP}=\text{Si}\,|\, \text{UA}=i) \]

con \(\small i=\lbrace \text{M. Interna, C. General, UCI}\rbrace\)
  • Hipótesis:

\[ \begin{cases} \text{H}_0: \pi_1=\pi_2=\pi_3 & \text{(homogeneidad)}\\ \text{H}_1: \text{al menos una } \pi_i \ne \pi_j \end{cases} \]

  • La hipótesis alternativa no especifica donde se da la diferencia, solo que no todas las proporciones son iguales.
  • Este tipo de test, que contrasta una hipótesis global, detecta si hay diferencias entre varios grupos o categorías, pero no identifica directamente donde está esa diferencia, se dice que es un test omnibus.
Resumen esquemático



Contraste de independencia

\(\tiny \blacksquare \,\,\) Lo desarrollamos con el ejemplo de la tabla 2 del Figura 1 presentada al inicio de este tema

  • Observamos que ahora solo hay una muestra, por tanto, no se puede hablar de homogeneidad.

  • Pregunta clínica: ¿Existe asociación entre el tipo de dispositivo invasivo utilizado y el estado del tejido en el punto de inserción (normal, inflamación o infección)?

  • Parámetros a contrastar: En el contraste de independencia no se contrastan directamente parámetros únicos, como proporciones, sino una estructura probabilística. La condición de independencia establece que, para cada combinación de clases, la probabilidad conjunta es igual al producto de las probabilidades marginales:

\[ \Pr(\text{Dispositivo} = i \cap \text{Estado}=j) =\Pr(\text{Dispositivo} = i) \times \Pr(\text{Estado}=j) \tag{1}\]

con \(\small i\) los distintos tipos de dispositivo y \(\small j\) los distintos estados.
  • Hipótesis: La hipótesis nula es la de independencia entre las dos variables, de acuerdo con la expresión anterior (Ecuación 1).

    La hipótesis alternativa es que ambas variables están asociadas
    La asociación se traduce en que la probabilidad de presentar un estado determinado, depende del tipo de dispositivo utilizado

Comentario sobre asociación entre variables cualitativas
  • En el análisis de variables cualitativas, el concepto de asociación se refiere exclusivamente a la existencia de una relación estadística entre las variables, en el sentido de que sus distribuciones conjuntas no pueden explicarse como producto de las distribuciones marginales. Esta noción de asociación es simétrica: desde el punto de vista estadístico, no distingue entre variable explicativa y variable respuesta, ni implica necesariamente una relación causal.

  • En muchos contextos aplicados, sin embargo, el planteamiento del problema introduce una direccionalidad conceptual. Así, puede ser razonable interpretar que una variable condiciona a la otra (asociación unidireccional), aunque el contraste de independencia mediante el test χ² solo evalúa la existencia de asociación global, sin establecer dirección ni causalidad.

  • En el ejemplo que estamos desarrollando, existe esa direcionalidad conceptual: primero se aplica el dispositivo y después se evalúa el estado. Sería correcto hablar de que “el estado del tejido está asociado al tipo de dispositivo”, pero no los sería decir que “el dispositivo está asociado al estado”.


Resumen esquemático

Importante: Asociación no implica causalidad ni direccionalidad, aunque el contexto clínico pueda introducir una direccionalidad implícita y sugerir una interpretación causal.



Esquema metodológico
Figura 6: Secuencia metodológica para el test χ²



2.2 Desarrollo del test \(\chi^2\)

Frecuencias esperadas y condición de validez

\(\tiny \blacksquare \,\,\) Frecuencias esperadas

Si la hipótesis nula es cierta, y dadas las distribuciones marginales observadas (totales de filas y de columnas), las frecuencias que cabría esperar en cada celda de la tabla de contingencia se obtienen como

\[ E_{ij}=\frac{F_i \times C_j}{T} \]

donde, como ya introdujimos anteriormente, \(\small F_i\)​ es el total de la fila \(\small i\), \(\small C_j\)​ el total de la columna \(\small j\) y \(\small T\) el total general de la tabla.

Esta expresión es válida tanto si la hipótesis nula plantea homogeneidad entre poblaciones como si plantea la independencia entre variables. Aunque el razonamiento conceptual que conduce a la hipótesis nula es distinto en cada caso, el cálculo de las frecuencias esperadas es idéntico.

En los ejemplos
Figura 7: Las frecuencias esperadas bajo la hipótesis nula se obtienen de la misma forma en un test de homogeneidad y en uno de independencia.
Obsérvese que las frecuencias marginales (los totales de filas y columnas) no cambian.

\(\tiny \blacksquare \,\,\) Condición de validez

La validez del test χ² descansa en que no haya frecuencias esperadas muy pequeñas, concretamente:

  • Ninguna frecuencia esperada puede ser menor a 1.
  • Si hay frecuencias esperadas inferiores a 5, no pueden representar más del 20% del total.
En los ejemplos
  • En la tabla 3x2 del test de homogeneidad, podría haber \(\small 6\times 0.2=1.2\) frecuencias esperadas inferiores a 5 (todas siempre mayores a 1). Esto quiere decir que si hubiera solo una, el test sería válido, pero si hubiera dos ya no.
  • En la tabla 3x3 del test de independencia, podría haber \(\small 9 \times 0.2=1.8\) frecuencias esperadas menores a 5, de manera que la condición es la misma que en el caso anterior.
  • En general, el software informa sobre el cumplimiento de la condición de validez indicando:
    • Cuánto vale la frecuencia mínima esperada ← Aquí hay que comprobar que no es menor a 1.
    • Qué proporción de frecuencias esperadas son menores a 5 ← Hay que comprobar que no son más de un 20%


Estadístico de contraste \(\chi^2\)

\(\tiny \blacksquare \,\,\) Preámbulo:

  • Las frecuencias esperadas \(\small E_{ij}\)​ no representan valores observados ni predicciones individuales, sino los recuentos teóricos que se obtendrían en cada celda de la tabla si la hipótesis nula fuese cierta.
  • Su cálculo se basa exclusivamente en los totales marginales observados y refleja la situación en la que no existe asociación entre las variables (hipótesis de independencia) o en la que las distribuciones son iguales entre los grupos comparados (hipótesis de homogeneidad).
  • La comparación entre las frecuencias observadas y las esperadas permite cuantificar el grado de discrepancia de la información empírica respecto a la hipótesis nula, siendo esta discrepancia la base del estadístico \(\small \chi^2\)

\(\tiny \blacksquare \,\,\) Desarrollo del estadístico \(\small \chi^2\)

  • El objetivo del estadístico \(\small \chi^2\) es medir la discrepancia existente entre las frecuencias observadas y las frecuencias esperadas bajo la hipótesis nula. En cada celda de la tabla de contingencia, esta discrepancia viene dada por la diferencia

\[ O_{ij}-E_{ij} \]

  • A cada una de estas diferencias se la denomina residuo, de modo que para cada celda puede definirse un residuo

\[ r_{ij}=O_{ij}-E_{ij} \]

  • Dado que las frecuencias esperadas y las observadas tienen el mismo total, la suma de todos los residuos es nula. Por este motivo, y para evitar que discrepancias positivas y negativas se compensen entre sí, los residuos se elevan al cuadrado, de forma análoga a lo que ocurre en la definición de la varianza en estadística descriptiva.

  • Finalmente, para que la magnitud de cada discrepancia sea interpretable en relación con el tamaño esperado de la celda correspondiente, cada residuo al cuadrado se pondera dividiéndolo por su frecuencia esperada. De este modo, el estadístico \(\small \chi^2\) viene dado por

\[ \chi^2_{\text{exp}}=\sum_i{\sum_j{\frac{(O_{ij}-E_{ij})^2}{E_{ij}}}} \]

  • Bajo la hipótesis nula, el estadístico de contraste \(\small \chi^2_{\text{exp}}\) sigue una distribución \(\small \chi^2\) teórica con \(\small (r-1)\times(c-1)\) grados de libertad, lo que permite determinar el valor de \(\small p\) asociado al contraste de hipótesis.

Los grados de libertad \(\small (r-1)\times(c-1)\) asociados al estadístico \(\small \chi^2_{\text{exp}}\) reflejan el número de celdas cuyo contenido puede variar libremente una vez fijados los totales marginales.

  • Interpretación. Veamos las dos situaciones que pueden ocurrir:
    • Si es cierta \(\small \text{H}_0\) \(\, \Rightarrow\) en general \(\small \, O_{ij} \approx E_{ij}\) \(\quad \Rightarrow \quad\) \(\small \chi^2_{\text{exp}} \searrow 0\) \(\quad \Rightarrow \quad\) \(\small p \nearrow 1\) \(\quad \Rightarrow \quad\) si \(\small\, p> \alpha\quad\) el test no es significativo
    • Si no es cierta \(\small \text{H}_0\) \(\, \Rightarrow\) en general \(\small \, O_{ij} \ne E_{ij}\) \(\quad \Rightarrow \quad\) \(\small \chi^2_{\text{exp}}\) \(\nearrow\nearrow\) \(\quad \Rightarrow \quad\) \(\small p \searrow 0\) \(\quad \Rightarrow \quad\) si \(\small \, p\le \alpha\quad\) el test es significativo

\(\tiny \blacksquare \,\,\) Justificación de la condición de validez del test \(\small \chi^2\)

  • Si existen frecuencias esperadas muy pequeñas, por ejemplo menores que 1, el cociente \[ \frac{(O_{ij}-E_{ij})^2}{E_{ij}} \]

    puede tomar valores arbitrariamente grandes. En estas condiciones, el estadístico \(\small \chi^2_{\text{exp}}\) puede resultar elevado, pero no por que exista una discrepancia relevante entre las frecuencias observadas y las esperadas, sino como consecuencia de la inestabilidad introducida por un denominador excesivamente pequeño.

  • Además, una proporción grande de frecuencias esperadas de magnitud reducida provoca que la distribución de \(\small \chi^2_{\text{exp}}\) se aparte de la \(\small \chi^2\) teórica de referencia. Con lo que el valor \(\small p\) obtenido deja de ser fiable y el contraste pierde validez inferencial.

Con frecuencias esperadas pequeñas, la aproximación \(\small \chi^2\) falla y el contraste tiende a rechazar la hipótesis nula con demasiada facilidad (se hace liberal).

Estadístico de contraste y condición de validez en los dos ejemplos
Figura 8: Salida del test \(\small \chi^2\) de la función tablarxc() del paquete BioestadisticaR2
Análisis de la significación del test \(\chi^2\)

El test \(\small \chi^2\) es un test omnibus: un resultado significativo \((\small p \le \alpha)\) indica discrepancias globales, pero no informa sobre su localización, su sentido ni su magnitud.

\(\tiny \blacksquare \,\,\) Métodos de análisis de las causas de significación

  • Análisis de los porcentajes observados. Método descriptivo, sin validez inferencial. Puede utilizarse con fines interpretativos y para la comunicación de resultados, una vez establecido el rechazo de la hipótesis nula.

  • Partición de tablas. Consiste en la descomposición de una tabla de contingencia en subtablas más simples. Es un método clásico, útil en determinados contextos específicos (no se aborda en este curso).

  • Análisis de residuos estandarizados. Método preferible en la práctica actual. Es objetivo, claro y permite identificar qué celdas contribuyen a la significación del test.

\(\tiny \blacksquare \,\,\) Análisis de los residuos estandarizados

Existen diferentes formas de estandarizar los residuos en el análisis del test \(\small \chi^2\), en el contexto que nos ocupa, se emplean preferentemente el residuo de Pearson, de interpretación más intuitiva, y el residuo estandarizado ajustado, que es el que suelen implementan los paquetes estadísticos.

El residuo de Pearson o residuo estandarizado simple asociado a la celda \(\small (i,\,j)\) se define como \[ r_{ij}^{*}=\frac{O_{ij}-E_{ij}}{\sqrt{E_{ij}}} \]

  • Bajo la hipótesis nula, estos residuos siguen aproximadamente una distribución normal estándar, lo que facilita su interpretación.

  • Del residuo debe interpretarse, en primer lugar, su magnitud y, únicamente cuando esta es relevante, su signo, de forma análoga a la interpretación de un valor tipificado.

    • Magnitud. Indica la relevancia de la discrepancia:
      • \(\small |r_{ij}^{*}| < 2\) → indica concordancia entre lo observado y lo esperado
      • \(\small |r_{ij}^{*}| > 2\) → sugiere discrepancias relevantes
      • \(\small |r_{ij}^{*}| > 3\) → indica discrepancias muy acusadas y una contribución importante al valor de \(\small \chi^2_\text{exp}\)
    • Signo. Indica el sentido de la discrepancia
      • \(\small r_{ij}^{*} < 0\) → La frecuencia observada es menor que la esperada.
      • \(\small r_{ij}^{*} > 0\) → La frecuencia observada es mayor que la esperada.
  • El residuo estandarizado ajustado tiene en cuenta que los totales marginales está fijados y mejora la aproximación a la normal estándar de los residuos simples. Es el recomendado para el análisis formal (Agresti, 2013).

Residuos estandarizados ajustados en los dos ejemplos
Figura 9: Residuos estandarizados ajustados. Se destacan los residuos significativos
Tamaño del efecto, la fuerza de la asociación

El test \(\small \chi^2\) permite determinar si existe o no asociación entre variables categóricas, pero no informa sobre la intensidad de dicha asociación.

  • Como en otros test, el valor del estadístico de contraste \(\small \chi^2_{\text{exp}}\) depende del tamaño muestral, de modo que en muestras grandes discrepancias pequeñas pueden resultar estadísticamente significativas. Por este motivo, tras un contraste significativo resulta necesario complementar el análisis con una medida de tamaño del efecto.

  • En el caso de tablas de contingencia grandes \(\small r \times c\), con \(\small r>2\,\) y/o \(\small \, c>2\), la medida de fuerza de asociación más utilizada es el coeficiente \(\small V\) de Cramér.

El coeficiente \(\small V\) de Cramér se define como

\[ V=\sqrt{\frac{\chi^2_{\text{exp}}}{T(k-1)}} \]

en donde \(\small k\) es la menor de las dimensiones de la tabla (número de filas o de columnas) y \(\small 0 \le V \le 1\)

  • Si \(\small V \searrow 0\) indica ausencia de asociación o asociación débil entre las variables

  • Si \(\small V \nearrow 1\) indica asociación intensa

  • El intervalo de confianza para este coeficiente no es inmediato. Se suele utilizar el método bootstrap.
    En R lo implementa el paquete ufs:

    ufs::confIntV(tabla, conf.level = 0.95, method = "bootstrap")
  • El coeficiente \(\small V\) de Cramér proporciona una información complementaria al resultado del test \(\small \chi^2\), permitiendo distinguir entre significación estadística y relevancia clínica

  • Su uso es especialmente recomendable en estudios con tamaños muestrales grandes y tablas de múltiples categorías.

  • Limitaciones:
    • Esta medida carece de una interpretación clínica directa, como veremos que sí tienen las medidas asociadas a las tablas 2x2.
    • Es una medida simétrica: no distingue entre variable explicativa y variable respuesta.
    • Puede dar valores muy bajos en situaciones clínicamente importantes, especialmente cuando el suceso de interés es poco frecuente o cuando los datos están muy desbalanceados.
    • No permite comparaciones directas entre niveles concretos de las variables. Resume toda la información de la tabla en un único valor global, sin identificar qué categorías son las que están asociadas ni en qué medida.
Resolución completa de los dos ejemplos (BioestadisticaR2)
Tabla 1. Test de homogeneidad
# Carga del paquete ----                                                                                               .
library(BioestadisticaR2)

# Introducción de datos (por columnas) ----
Si <- c(12, 8, 20)
No <- c(88, 92, 80)
tabla1 <- data.frame(Si, No)
rownames(tabla1) <- c("MInterna", "CGeneral", "UCI") # <- etiquetado de las filas

# Test + solicitud de tablas:
#   E = frecuencias esperadas
#   F = % por filas
#   R = residuos de Pearson
#   S = residuos estandarizados ajustados
tablarxc(frecs = tabla1, tablas = c("E", "F", "R", "S"))

# Test Chi-cuadrado para tablas RxC
# ---------------------------------

# Frecuencias observadas
             Si   No Total
  MInterna   12   88   100
  CGeneral    8   92   100
  UCI        20   80   100
  Total      40  260   300

# Frecuencias esperadas
               Si     No  Total
  MInterna  13.33  86.67 100.00
  CGeneral  13.33  86.67 100.00
  UCI       13.33  86.67 100.00
  Total     40.00 260.00 300.00

# Test chi-cuadrado 
  Validez: Frecuencia mínima esperada = 13.33 
           0 frecuencias esperadas son menores a 1
           0 son menores a 5 (el 0% de la tabla) 
  χ²(2 gl) = 6.462, p = 0.04 

# Residuos de Pearson
               Si     No
  MInterna -0.365  0.143
  CGeneral -1.461  0.573
  UCI       1.826 -0.716

# Residuos estandarizados
               Si     No
  MInterna -0.480  0.480
  CGeneral -1.921  1.921
  UCI       2.402 -2.402

# Porcentajes por filas
              Si    No Total
  MInterna 0.120 0.880 1.000
  CGeneral 0.080 0.920 1.000
  UCI      0.200 0.800 1.000
  Total    0.133 0.867 1.000
Tabla 2. Test de independencia
# Carga del paquete ----                                                                                               .
library(BioestadisticaR2)

# Introducción de datos (por columnas) ----
normal <- c(25, 14, 16)
inflamacion <- c(6, 8, 5)
infeccion <- c(5, 15, 3)
tabla2 <- data.frame(normal, inflamacion, infeccion)
rownames(tabla2) <- c("via", "cateter", "sonda")

# Test + solicitud de tablas ----
tablarxc(frecs = tabla2, tablas = c("E", "F", "C", "S"))

# Test Chi-cuadrado para tablas RxC
# ---------------------------------

# Frecuencias observadas
            normal   inflamacion   infeccion Total
  via           25             6           5    36
  cateter       14             8          15    37
  sonda         16             5           3    24
  Total         55            19          23    97

# Frecuencias esperadas
            normal   inflamacion   infeccion Total
  via        20.41          7.05        8.54 36.00
  cateter    20.98          7.25        8.77 37.00
  sonda      13.61          4.70        5.69 24.00
  Total      55.00         19.00       23.00 97.00

# Test chi-cuadrado 
  Validez: Frecuencia mínima esperada = 4.7 
           0 frecuencias esperadas son menores a 1
           1 son menores a 5 (el 11.1% de la tabla) 
  χ²(4 gl) = 11.184, p = 0.025 

# Residuos estandarizados
            normal   inflamacion   infeccion
  via        1.946        -0.557      -1.747
  cateter   -2.944         0.397       3.060
  sonda      1.136         0.177      -1.489

# Porcentajes por filas
            normal   inflamacion   infeccion Total
  via        0.694         0.167       0.139 1.000
  cateter    0.378         0.216       0.405 1.000
  sonda      0.667         0.208       0.125 1.000
  Total      0.567         0.196       0.237 1.000

# Porcentajes por columnas
            normal   inflamacion   infeccion Total
  via        0.455         0.316       0.217 0.371
  cateter    0.255         0.421       0.652 0.381
  sonda      0.291         0.263       0.130 0.247
  Total      1.000         1.000       1.000 1.000






3 Tablas de contingencia 2x2

\(\tiny \blacksquare \,\,\) Son un caso particular de las tablas de contingencia de especial interés en bioestadística, epidemiología y salud pública

  • Constituyen un resumen sencillo de la relación entre dos variables dicotómicas.
    En particular, las variables que vamos a considerar son
    • La exposición o presencia de un factor de riesgo (con modalidades exposición/no exposición, presente/ausente, sí/no,…)
    • La presencia, o no, de una respuesta o desenlace en salud (también con modalidades presente/ausente, sí/no,…)

En este contexto, cuando una de las variables representa la exposición a un factor de riesgo y la otra la aparición de una respuesta, se asume una relación temporal: la exposición (o no exposición) precede al desarrollo (o no) del desenlace.

  • De este modo, se representan de forma natural problemas habituales en ciencias de la salud:
    • Evaluación de factores de riesgo
    • Efectividad de intervenciones y tratamientos
    • Estudios de cribado
    • Comparación entre grupos expuestos y no expuestos
    • Análisis de resultados clínicos binarios
  • Este tipo de tablas constituye la base para el cálculo de las medidas de asociación más utilizadas en epidemiología:
    • Medidas de riesgo: riesgos absoluto, relativo o atribuible
    • Razón de ventajas (odds ratio)

Las tablas 2×2 no son solo un caso particular de las tablas de contingencia, constituyen la base conceptual del análisis epidemiológico. Este es el fundamento del aforismo

“Antes que con modelos sofisticados, la epidemiología empieza con cuatro números bien colocados.”



3.1 Particularidades de las tablas 2x2

Formato de presentación
  • En total, hay 8 formas posibles de presentar el cruce de dos variables binarias en forma de tabla de contingencia 2x2

  • En el ámbito epidemiológico, tradicionalmente se ha adoptado la representación “filas = Factor de Riesgo / columnas = Desenlace” (en muchos textos se alude a ella como formato canónico epidemiológico), pero no en todos los ámbitos se mantiene este formato.
    • La tabla puede rotarse
    • Es importante tener claro qué representa cada celda
  • El test \(\small \chi^2\) da el mismo resultado independientemente de la colocación de las variables o del orden de filas y columnas;
  • Sin embargo, el formato estructural de la tabla es determinante para la definición, el cálculo y la interpretación las medidas descriptivas y de las medidas de asociación que se pueden derivar de la tabla.

El paquete BioestadísticaR2 analiza las tablas 2x2 con el formato “filas = desenlace / columnas = factor de riesgo”, que es el usado en algunas de las referencias recomendadas (Martín Andrés & Luna del Castillo, 2004, 2013).

Ejemplo

Formato usual en epidemiología (izda.) y el considerado en otros ámbitos (dcha., es el considerado por BioestadisticaR2)
Esquemas de construcción de la tabla

\(\tiny \blacksquare \,\,\) Una tabla de contingencia 2x2 se puede construir a partir de la información de una sola muestra, o mediante dos grupos definidos por el diseño

  • El contraste puede formularse como de independencia o de homogeneidad; en la práctica, ambos se basan en el mismo estadístico.
  • El diseño implica qué marginales son valores fijados y cuáles son variables aleatorias, lo que condiciona qué medidas son estimables.

Esquemas posibles de construcción:

  • Tipo I Sin condicionamiento, no hay marginales fijados, las dos distribuciones marginales son variables aleatorias.
    • Se considera una sola muestra cuyas observaciones se clasifican en función de las categorías de exposición y de respuesta ← Contraste de independencia
    • Típico de estudios transversales.
  • Tipo II: Con condicionamiento, uno de los marginales está fijado, el otro es aleatorio.
    Comparación de grupos definidos por diseño. ← Contraste de homogeneidad

    • Condicionamiento por exposición
      • Se fija el número de expuestos y no expuestos
      • Tìpico de estudios prospectivos:
        • Estudios de cohortes. No hay asignación de los sujetos a cada categoría (la exposición ya existe)
        • Ensayos clínicos. De tipo experimental, con asignación (aleatorizada) de los sujetos
    • Condicionamiento por respuesta
      • Se fija el número de casos con la presencia/ausencia del suceso
      • Característico de estudios de casos y controles, habitualmente retrospectivos: Se parte de la presencia/ausencia del efecto y se busca la causa en el pasado (se investiga retrospectivamente la exposición).

El diseño no solo determina cómo se recogen los datos, sino qué probabilidades se estan modelizando

Ejemplo

Test \(\chi^2\) en tablas de contingencia 2x2

\(\tiny \blacksquare \,\,\) Como en las tablas más grandes, el test \(\small \chi^2\) permite contrastar la hipótesis nula

  • de independencia, si solo hay una muestra (esquema de tipo I)
  • de homogeneidad, cuando hay dos muestras (esquema de tipo II)
\(\tiny \blacksquare \,\,\) En tablas 2x2
  • El test puede ser impreciso, al tratarse de una distribución discreta que puede no quedar bien aproximada por la distribución (continua) \(\small \chi^2\)
  • Corrección por continuidad. Con el fin de evitar sobreestimar la significación, se suele restar al numerador una cantidad \(c\) denominada corrección por continuidad (cpc).
  • En muchas referencias, la formulación explícita del estadístico de contraste en tablas 2x2 se simplifica en

\[ \chi^2_{\text{exp}}=\frac{\left(|O_{11} O_{22} - O_{12} O_{21}| - c\right)^2}{F_1F_2C_1C_2}T \]

En donde \(c\) es la cpc y la notación \(\small O_{ij}, F_i, C_j\) y \(\small T\) es la introducida al inicio.

Valores de la cpc
  • La cpc clásica es la de Yates: \(\small c =T/2\)
    • Puede dar lugar a un test demasiado conservador
    • Hoy día, su uso está criticado por muchos autores
  • Martín Andrés & Luna del Castillo (2017) sugieren como cpc óptima
    • En los diseños de tipo I: \(\small c = 0.5\)
    • En los diseños de tipo II: \(\small c = 1\) si \(\small n_1 \ne n_2\) y \(\small c = 2\) si \(\small n_1 = n_2\)
  • Condición de validez. La condición de validez clásica es que todas las frecuencias esperadas sean mayores a 5 (la misma que en las tablas grandes). Como la frecuencia mínima esperada es
\[ E=\frac{\min\left({F_1,\, F_2}\right)\min\left({C_1,\, C_2}\right)}{T} \]

basta con que sea \(\small E>5\)

Condición de validez actualizada
  • Martín Andrés & Luna del Castillo (2017) sugieren como condición de validez
    • En los diseños de tipo I: \[ \begin{cases} E \ge 6.2 & \text{si} \quad T>500 \\ E \ge 3.9 & \text{si}\quad T\le 500 \end{cases} \]

    • En los diseños de tipo II: \[ \begin{cases} E \ge 14.9 & \text{si} \quad T>500 \\ E \ge 7.7 & \text{si}\quad T\le 500 \end{cases} \]

  R
La función tabla2x2() del paquete BioestadisticaR2 proporciona el test \(\small \chi^2\) con la cpc y la condición de validez conformes con las propuestas por Martín Andrés & Luna del Castillo (2017)
Alternativas al test \(\chi^2\) en tablas 2x2

\(\tiny \blacksquare \,\,\) Test de Fisher

  • Alternativa más usual al test \(\small \chi^2\) cuando no se cumple la condición de validez.
  • Es un test exacto.
  • Calcula la probabilidad exacta de la tabla condicionando a los marginales.
  • Por su construcción, es más coherente cuando hay marginales fijados (tipo II), pero se puede usar siempre.
  • Es conservador.

\(\tiny \blacksquare \,\,\) Test de Barnard

  • Es también un test exacto.
  • No condicionado a los marginales.
  • Es más potente que los test \(\small \chi^2\) y de Fisher.
  • Por su construcción, es más coherente cuando los marginales son aleatorios (tipo I), pero se puede usar siempre.
  • Es menos conocido, poco frecuente en estudios aplicados.

El test de Fisher es exacto pero condicionado a los marginales; el de Barnard es exacto sin condicionamiento y, por ello, generalmente más potente.

R Implementaciones de estos test:

  • La función tabla2x2() del paquete BioestadisticaR2 proporciona el test de Fisher junto con el \(\small \chi^2\).
  • El paquete Barnard realiza el test de Barnard a través de la función barnard.test().
  • El paquete Exact implementa los test exactos de Fisher y de Barnard (y alguno más, como el de Boschloo) a través de la función exact.test(), especificando en el argumento method, cuál es el método deseado.




3.2 Medidas en tablas 2x2

\(\tiny \blacksquare \,\,\) Medidas de frecuencia

  • A partir de la información de la tabla 2x2 podemos obtener medidas descriptivas con interés inferencial, como son la prevalencia y el riesgo absoluto.
  • Estas medidas no siempre se pueden calcular, están condicionadas al diseño del estudio.

\(\tiny \blacksquare \,\,\) Medidas de asociación

  • El test \(\small \chi^2\) permite evaluar si existe asociación entre las dos variables cualitativas; sin embargo, este contraste no informa sobre la magnitud ni la dirección de dicha asociación.

  • Para ello, es necesario recurrir a medidas de asociación, cuya elección depende del diseño del estudio (una muestra o dos muestras, estudios prospectivos o retrospectivos).

  • Estas medidas pueden formularse

    • Como diferencias, como es el caso del la diferencia de riesgos o el riesgo atribuible, donde el valor nulo (de no efecto) es 0 (ausencia de efecto o de incremento del riesgo),
    • Como cocientes, como el riesgo relativo o la odds ratio, donde el valor nulo es 1 (ausencia de asociación).
Asociación positiva y negativa en tablas 2x2

\(\tiny \blacksquare \,\,\) Al tratar con variables nominales, la noción de asociación positiva o negativa no es intrínseca a las variables, sino que depende de la codificación adoptada.

Se dice que hay asociación positiva cuando, bajo la codificación adoptada, la presencia de una categoría de una variable (habitualmente la exposición al factor) aumenta la probabilidad de la categoría “alta” (o positiva) de la otra (habitualmente la presencia del suceso de interés).


El hecho de hablar de asociación “positiva”/“negativa” viene determinado por la asignación numérica convencional 0/1 a las categorías de cada variable, que no poseen un orden natural.

  • De forma habitual, se asigna el valor 1 a la categoría de interés:
    • En el factor: la categoría “expuesto” → “Factor = 1”
    • En la respuesta: “desenlace = presente” → “Respuesta = 1”
  • En adelante se usará la notación
    • \(\small FR\) para la exposición o no al factor, con \(\small FR=1\) para expuestos y \(\small FR=0\) para no expuestos.
    • \(\small D\) para la presencia o no de la respuesta, con \(\small D=1\) para respuesta presente y \(\small D=0\) para respuesta ausente (en los textos en inglés, \(\small D\) alude a la enfermedad, disease).
  • En estos términos, se habla de asociación positiva entre la exposición al factor y la presencia de la respuesta cuando sea

\[ \Pr(D=1\,|\, FR = 1) > \Pr(D=1\,|\,FR= 0) \]

y de asociación negativa en caso contrario:

\[ \Pr(D=1\,|\, FR = 1) < \Pr(D=1\,|\,FR = 0) \]


Qué medidas se pueden calcular y qué representa cada una es una cuestión dependiente del diseño. A continuación se abordan las medidas propias de cada diseño. Es importante tener en cuenta que

La tabla 2×2 es la misma; lo que cambia es el diseño, y con él, el significado epidemiológico de las medidas.

Analizaremos tres esquemas de cálculo. Aunque distintas medidas pueden compartir la misma expresión matemática y dar lugar al mismo valor, su significado y su interpretación varían según el diseño del estudio.




3.2.1 Diseño sin condicionamiento (tipo I)

Esquema general

Razón de prevalencias (\(\small RP\))

La razón de prevalencias cuantifica la fuerza de asociación entre la exposición y la aparición del desenlace en términos de frecuencia observada en un momento dado.

Su interpretación debe limitarse al plano descriptivo, ya que no informa sobre la secuencia temporal ni sobre el riesgo de aparición del suceso.


Diferencia de prevalencias (\(\small DP\))

La diferencia de prevalencias (DP) se define como la diferencia absoluta en la frecuencia del suceso entre expuestos y no expuestos en un momento dado.

Es una medida absoluta, a diferencia del cociente de prevalencias, que es relativa.

  • RP mide “cuantas veces más”
  • DP mide “cuánto más”

Puede haber una asociación relativa fuerte, pero con impacto absoluto pequeño.
Por ejemplo: los mismos datos pueden dar lugar a \(\small RP=2\) (la prevalencia en los expuestos es el doble que en no expuestos), pero ser \(\small DP=0.02\) (solo hay un aumento del 2% de la primera a la segunda).





Razón del producto cruzado (odds ratio) (\(\small OR\))

Dada una probabilidad o una proporción, \(\,\small p\,\), se llama ventaja (odds, en inglés) al cociente

\[ odds=\frac{p}{(1-p)} \]

La odds ratio (\(\small OR\)) se construye como un cociente de ventajas.
Concretamente, \(\small OR\) es el cociente entre la ventaja de tener el desenlace frente a no tenerlo en los expuestos, dividida por la ventaja de tener el desenlace frente a no tenerlo en los no expuestos.



Comentarios sobre las medidas
  • En estudios transversales, todas las medidas cuantifican asociación entre prevalencias, no se puede hablar de riesgos, por lo que su interpretación debe limitarse al plano asociativo (no causal) (un estudio transversal constituye una “foto fija” de la población).

  • La \(\small DP\) depende de la prevalencia basal. Para comparar distintas poblaciones es preferible, en general, una medida relativa, como la \(\small RP\).

  • La \(\small DP\) puede tomar valores bajos y, sin embargo, ser clínicamente relevante. Por ejemplo si la población es grande, un valor \(\small \widehat{DP}=0.01\) puede tener un impacto importante.

  • La \(\small OR\)

    • No es un riesgo, ni una probabilidad, sino un cociente de ventajas (odds). Su interpretación es menos intuitiva que la de las otras medidas.
    • Es una medida simétrica, intercambiar filas y columnas no cambia su magnitud. Desde el punto de vista matemático, es la medida más conveniente en tablas 2x2. De hecho, es la base de los modelos de regresión logística, de gran interés en ciencias de la salud.
    • Cuando la prevalencia de la enfermedad (\(\small \Pr(D=1)\)) es baja \(\small OR \approx RP\)
    • Cuando la prevalencia es alta, la \(\small OR\) se aleja de la \(\small RP\) y tiende a sobreestimar la asociación (\(\small OR > RP\)).
    • Como ocurre en \(\small RP\) y \(\small DP\), la \(\small OR\) se basa en prevalencias, por eso, en estudios transversales, se la denomina odds ratio de prevalencia (prevalence odds ratio)
  • La \(\small OR\) es la mejor opción para modelizar (punto de vista estadístico); la \(\small RP\) y la \(\small DP\) son más adecuadas para la interpretación clínica.



3.2.2 Diseño con condicionamiento por exposición (tipo II)

Riesgo

En diseños en los que se condiciona a la exposición (estudios de cohortes y ensayos clínicos), la noción clave es la de riesgo, como medida de frecuencia y como base de las medidas de asociación.

El riesgo es la probabilidad de que un individuo, inicialmente libre del suceso o desenlace de interés, desarrolle dicho desenlace durante un periodo de seguimiento definido.

En estudios prospectivos —tanto de cohortes como ensayos clínicos— bien diseñados, en los que el seguimiento es cerrado (es decir, se identifican todos los sujetos en riesgo en el momento basal, no se incorporan nuevos individuos durante el estudio y todos los participantes se observan durante un periodo de tiempo definido), el riesgo coincide con la incidencia acumulada:

\[ \text{Riesgo}=\frac{\text{Nº de casos nuevos durante el periodo}}{\text{Nº de individuos al inicio del estudio}} \]

  • Un riesgo es una proporción que estima la probabilidad de que un individuo inicialmente libre del desenlace lo desarrolle a lo largo de un periodo de tiempo definido. Su cálculo requiere que:
    • El periodo de observación esté claramente especificado.
    • El numerador incluya solo los casos incidentes.
    • El denominador esté formado exclusivamente por la población en riesgo al inicio del seguimiento
  • Los riesgos se definen para los grupos, o cohortes
    • Expuestos \(\small R_{FR=1}=\Pr(D=1|FR=1)\)
    • No expuestos \(\small R_{FR=0}=\Pr(D=1|FR=0)\)
  • Los riesgos son medidas absolutas de frecuencia, cuantifican directamente cuántos individuos presentan el suceso en un grupo concreto, sin compararlo con ningún otro grupo.
  • Constituyen la base para obtener las medidas comparativas como el riesgo relativo (\(\small RR\)) y la diferencia de riesgos (\(\small DR\))
Esquema general



Riesgo relativo (\(\small RR\))

Formalmente es equivalente a la razón de prevalencias (\(\small RP\)) de los estudios transversales, pero en este contexto es apropiado hablar de riesgo.

  • El \(\small RR\) compara la probabilidad de enfermar a lo largo del tiempo entre expuestos y no expuestos.
  • Se basa en incidencias acumuladas (riesgos) y, por tanto, exclusivamente en casos nuevos.
  • En contraste, la razón de prevalencias (\(\small RP\)), propia de los estudios transversales, se basa en prevalencias, que incluyen casos antiguos y nuevos y carecen de información temporal.


\(\small RR\) y \(\small RP\) pueden compartir expresión matemática, pero difieren en su base epidemiológica: incidencia con tiempo (\(\small RR\)) frente a prevalencia sin tiempo (\(\small RP\)).


Diferencia de riesgos (\(\small DR\))

La diferencia de riesgos es una medida absoluta de asociación que cuantifica el exceso (o defecto) de riesgo atribuible a una exposición.

Formalmente análoga a la diferencia de prevalencias (\(\small DP\)) de los estudios transversales (la equivalencia es estructural, no conceptual)

  • Como ya ocurría con el riesgo relativo (\(\small RR\)) y la razón de prevalencias (\(\small PR\)), la medida base en \(\small DR\) es la incidencia acumulada (riesgo), mientras que en la \(\small DP\) es la prevalencia.
  • La \(\small DR\) cuantifica los casos atribuibles a la exposición; la \(\small DP\) cuantifica las personas enfermas en exceso en un momento dado, sin referencia temporal
  • La \(\small DR\) permite inferir el impacto causal potencial, mientras que la \(\small DP\) solo caracteriza la diferencia de estados en el instante de la observación.
  • A diferencia de la \(\small DP\), la \(\small DR\) no está influida por la duración de la enfermedad.


Como ocurría con el riesgo relativo (\(\small RR\)) y la razón de prevalencias (\(\small RP\)), la diferencia de riesgos (\(\small DR\)) y la diferencia de prevalencias (\(\small DP\)) comparten la expresión matemática, pero difieren en su base epidemiológica.

  • La \(\small DR\) se basa en incidencias acumuladas (riesgos)
  • La \(\small DP\) se basa en prevalencias, que no incorporan información sobre la ocurrencia del evento a lo largo del tiempo.


Razón del producto cruzado (odds ratio)
  • La construcción de la medida es la misma que la expuesta en los diseños no condicionados. La diferencia es conceptual:
    La odds ratio cuantifica la ventaja de desarrollar el evento durante el seguimiento frente a no desarrollarlo, es decir, compara las ventajas (odds) de incidencia del desenlace entre expuestos y no expuestos ← ahora no se trata de una odds ratio de prevalencia.



Comentarios sobre las medidas
  • En estudios prospectivos (de cohortes y ensayos clínicos) hay una temporalidad clara: la exposición precede al desenlace.
    Como consecuencia:
    • Las medidas cuantifican asociación entre riesgos (incidencias acumuladas), y pueden interpretarse como medidas de asociación etiológica: la exposición podría ser una causa o un factor causal del desenlace.
    • Esta interpretación no es automática, el estudio debe de estar bien diseñado y se deben controlar sesgos y factores de confusión.
  • El riesgo relativo (\(\small RR\))
    • Es la medida más habitual de asociación en estudios prospectivos.
    • Cuantifica cuántas veces es mayor (o menor) el riesgo en expuestos respecto a no expuestos.
    • Tiene una interpretación directa y clínica.
  • La diferencia de riesgos (\(\small DR\))
    • Es una medida absoluta de asociación.
    • Cuantifica el exceso de riesgo en expuestos respecto a no expuestos.
    • Es especialmente útil para evaluar el impacto de la exposición, tanto a nivel clínico como en el ámbito de la salud pública.
    • Permite derivar otras medidas como la fracción atribuible en expuestos \[ FA_e=\frac{R_{FR=1}-R_{FR=0}}{R_{FR=1}} \] La \(\small FAe\) indica la proporción de casos incidentes entre los expuestos atribuible a la exposición, y que podría evitarse si esta se eliminara.
  • La odds ratio (\(\small OR\))
    • Es una medida relativa pero tiene una interpretación menos intuitiva que la del \(\small RR\).
    • Cuando el suceso es raro, \(\small OR \approx RR\) (en esta situación, ambas toman valores próximos al valor nulo 1)
    • Cuando el suceso es frecuente, la \(\small OR\) tiende a sobreestimar la asociación respecto al \(\small RR\) (cuando el riesgo deja de ser pequeño, la \(\small OR\) se dispara).

En estudios prospectivos, el riesgo relativo describe la fuerza de la asociación y la diferencia de riesgos su impacto absoluto; consideradas conjuntamente, ambas medidas proporcionan una visión completa del efecto de la exposición sobre la aparición del suceso. La odds ratio sigue siendo la medida natural en modelos de regresión logística, pero no es la que presenta mejor interpretación clínica.




3.2.3 Diseño con condicionamiento por respuesta (tipo II)

Esquema general



Razón del producto cruzado (odds ratio)

En este tipo de estudios, la odds ratio sigue siendo un cociente de ventajas, pero ahora las ventajas se definen de forma diferente

  • El condicionamiento es sobre la presencia del desenlace, no sobre la exposición al factor.
  • El cociente de las ventajas definidas así coincide con el cociente de las ventajas definidas al condicionar sobre la exposición.

Es decir, la conceptualización de diferente, pero el cálculo es el mismo que en los estudios anteriores.

Comentarios sobre las medidas
  • En los estudios en los que la selección de los individuos se realiza condicionando por la respuesta (se parte de casos \(\small D=1\) y controles \(\small D=0\)), no se puede estimar directamente la incidencia (riesgo) ni la prevalencia del suceso en la población, ya que la proporción de casos y controles está fijada por el diseño del estudio.

  • Por este motivo, no es apropiado hablar de riesgo ni de riesgo relativo (\(\small RR\)) en este diseño.

  • Las medidas descriptivas se limitan a la distribución de la exposición dentro de cada grupo:

    • Proporción de expuestos entre los casos
    • Proporción de expuestos entre los controles Estas cantidades no tienen interpretación poblacional directa, ya que dependen del muestreo.
  • La odds ratio (\(\small OR\)) es la única medida de asociación válida y consistente en este diseño, y constituye la medida central del análisis.

  • Bajo el supuesto de que el suceso es raro en la población, la \(\small OR\) puede interpretarse como una aproximación del riesgo relativo (\(\small RR\)). ¡Cuidado! este es el origen de muchas interpretaciones incorrectas

  • Cuando el suceso no es raro, la \(\small OR\), como ya ocurría en los diseños anteriores:

    • Tiende a sobreestimar la magnitud de la asociación
    • Debe interpretarse con cautela y siempre en términos de ventajas (odds), no de riesgo

En estudios de casos y controles no es posible estimar medidas absolutas (riesgo o diferencia de riesgos), por lo que la interpretación se centra exclusivamente en la asociación relativa entre exposición y desenlace a través de la \(\small OR\)




3.3 Tablas 2x2 en R

Función de BioestadisticaR2

Ejemplo para el diseño con condicionamiento en el factor (cohortes)

Código
#                                                                                        .
library(BioestadisticaR2)

tabla2x2(
  o11 = 40,
  o12 = 10,
  o21 = 160,
  o22 = 265,
  fcat = c("EPOC+", "EPOC–"),
  ccat = c("tab+", "tab–"),
  estudio = "p" # <- indicación del tipo de diseño ("t","p","r")
)

# Análisis de tablas 2x2
# ----------------------

# Frecuencias observadas
          tab+   tab– Total
  EPOC+     40     10    50
  EPOC–    160    265   425
  Total    200    275   475


# Test Chi-cuadrado para un estudio prospectivo

  χ² = 32.912,   gl = 1,  p < 0.001, (cpc = 1) 
  Validez: Frecuencia mínima esperada = 21.05  > 7.7  

  Test exacto de Fisher (bilateral): p < 0.001 

  --- Otros criterios χ²:  
  χ² = 32.920,   gl = 1,  p < 0.001, (sin cpc) 
  χ² = 31.205,   gl = 1,  p < 0.001, (cpc de Yates = 237.50) 

# Medidas de asociación para un estudio prospectivo
  [!] Las medidas de riesgo se calculan como riesgo de la categoría  
      en la 1a columna (frente a la 2a) para la categoría en la 1a 
      fila (frente a la 2a)

  Riesgo absoluto (diferencia de Berkson; método de Agresti-Caffo): 
  d=0.164; 95%-IC(d)=(0.103, 0.223) 

  Riesgo relativo: 
  Rr=5.500; 95%-IC(Rr)=(2.754, 10.186) 

  Razón del producto cruzado (odds ratio):
  OR=6.625; 95%-IC(OR)= (3.148, 12.932) 




4 Comparación de dos proporciones apareadas

\(\tiny \blacksquare \,\,\) Es muy frecuente la necesidad de comparar dos proporciones obtenidas sobre los mismos individuos. Esto ocurre, por ejemplo, cuando

  • cada paciente es evaluado en dos momentos distintos (antes/después de una intervención)
  • se aplican dos procedimientos diagnósticos diferentes al mismo sujeto.

En estas situaciones

  • las observaciones no son independientes, ya que ambas mediciones proceden del mismo individuo.
  • No es adecuado utilizar el test \(\small \chi^2\) de independencia para tablas 2×2, que asume independencia entre observaciones

El procedimiento habitual para comparar dos proporciones apareadas es el test de McNemar, diseñado específicamente para variables dicotómicas medidas dos veces sobre los mismos sujetos.


Este contraste se utiliza con frecuencia en investigación enfermera, por ejemplo:

  • Evaluación de programas educativos,
  • Comparación de técnicas de valoración clínica,
  • Estudios antes/después (pre-post) de intervenciones de cuidados,
  • Evaluación de adherencia terapéutica,
  • Comparación de presencia/ausencia de síntomas tras una intervención.
    Etc.



4.1 Test de McNemar

Ejemplo clínico

En una consulta de enfermería de atención primaria se realiza una intervención educativa dirigida a pacientes con hipertensión arterial, centrada en la importancia de la adherencia al tratamiento farmacológico.

Cada paciente es evaluado en dos momentos:

  • Antes de la intervención enfermera
  • Tres meses después

Los resultados observados en \(n=100\) pacientes son

  • 50 pacientes mantienen buena adherencia.
  • 15 pacientes siguen sin adherirse.
  • 10 pacientes pierden adherencia (empeoran).
  • 25 pacientes mejoran (pasan de no adherentes a adherentes).
Presentación de los datos

Los datos correspondientes a este tipo de estudio se presentan en forma de tabla 2x2, pero el formato de la tabla es diferente al que hemos visto hasta ahora para el test de independencia

  • Estamos manejando dos variables binarias: la adherencia al tratamiento (sí/no) y el instante de observación (antes/después)
  • En un test apareado se anidan las modalidades de una de las variables (la respuesta) en cada una de las modalidades de la otra (el instante) (tabla 1). Esto permite conservar la información apareada.
  • En un test de independencia construiríamos la tabla de contingencia colocando las modalidades de una de las variables en las filas y las de la otra en las columnas (tabla 2). Este formato es incorrecto, ya que
    • No conserva la información apareada
    • Se duplica (erróneamente) el número de observaciones. Las casillas de la tabla 2 contienen las distribuciones marginales de la tabla 1.

Test de McNemar

R El test de McNemar en R

Código base de R
#                                                                                        .
mcnemar.test(matrix(c(50, 10, 25, 15), nrow = 2))

    McNemar's Chi-squared test with continuity correction

data:  matrix(c(50, 10, 25, 15), nrow = 2)
McNemar's chi-squared = 5.6, df = 1, p-value = 0.01796
Función de BioestadisticaR2
#                                                                                        .
testmcnemar(n = c(50, 10, 25, 15))


# Inferencia con dos proporciones (muestras apareadas)
# ----------------------------------------------------

# Frecuencias observadas pretest x posttest
            +    - Total
   +       50   10    60
   -       25   15    40
   Total   75   25   100


# Proporciones observadas pretest x posttest
            +    - Total
   +     0.50 0.10  0.60
   -     0.25 0.15  0.40
   Total 0.75 0.25  1.00

# Test de McNemar: H₀:π₁₂=π₂₁
   Validez: n₁₂+n₂₁ = 35 > 10 el test es válido 
   Zexp =  2.4509 
               valor.p Alternativa
    Bilateral   0.0142  H₁:π₁₂≠π₂₁
    Unilateral  0.0071  H₁:π₁₂<π₂₁


# Test exacto de Fisher:
  H₀:π₁₂=0.5 para n₁₂ ~ B(n₁₂+n₂₁, π₁₂) 
               Valor.p Alternativa
    Bilateral   0.0432  H₁:π₁₂≠0.5
    Unilateral  0.0083  H₁:π₁₂<0.5
  ____
  * Aquí se alude a la probabilidad total de la discordancia, es decir que π₁₂+π₂₁=1

# Estimación de las proporciones individuales de discordancias π₁₂ y π₂₁ (método de Wald ajustado)
   [1] p₁₂ = 0.1154, 95%-IC(π₁₂) = (0.0540, 0.1768) 
   [2] p₂₁ = 0.2596, 95%-IC(π₂₁) = (0.1754, 0.3439) 


# Intervalo de confianza para la diferencia de 2 proporciones apareadas
   [1] Método de Wald (clásico con cpc):
      Estimación puntual de π₁₂-π₂₁ = -0.1500 
      Validez: n₁₂+n₂₁ = 35 > 5, el IC es válido 
      95%-IC(π₁₂-π₂₁) = (-0.2630, -0.0370) 

   [2] Método de Agresti-Min:
      Estimación puntual de π₁₂-π₂₁ = -0.1471 
      Validez: siempre es válido 
      95%-IC(π₁₂-π₂₁) = (-0.2588, -0.0354) 



5 Referencias y lecturas recomendadas

Agresti, A. (2013). Categorical Data Analysis (3.ª ed.). Hoboken, NJ: John Wiley & Sons.
Agresti, A., & Kateri, M. (2022). Foundations of Statistics for Data Scientists With R and Python (1st Ed.). Chapman & Hall/CRC Texts in Statistical Science.
Aguilera del Pino, A. M. (2001). Tablas de Contingencia Bidimensionales (1st Ed.). Madrid/Salamanca, Spain: Ed. La Muralla / Hespérides.
Martín Andrés, A., & Luna del Castillo, J. de D. (2004). Bioestadística para las Ciencias de la Salud. Madrid: Norma.
Martín Andrés, A., & Luna del Castillo, J. de D. (2013). 40 ± 10 horas de Bioestadística. Madrid: Ed. Norma-Capitel.
Martín Andrés, A., & Luna del Castillo, J. de D. (2017). Resúmenes y Tablas de Bioestadística. Madrid: Ed. Norma-Capitel.
Rosner, B. (2016). Fundamentals of Biostatistics (8.ª ed.). Boston: Brooks/Cole.


6 Material de este proyecto