En una unidad de investigación hospitalaria se está realizando un estudio para conocer si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad. Para ello se realizó un test oral de glucosa a dos muestras de pacientes sanos, unos jóvenes y otros adultos. El test consistió en medir el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) de 100 grs. de glucosa y a los 60 minutos de la toma. Los resultados fueron los siguientes
Jóvenes
Basal |
90 |
82 |
80 |
75 |
74 |
97 |
76 |
89 |
83 |
77 |
60min |
136 |
151 |
148 |
138 |
141 |
157 |
154 |
156 |
147 |
141 |
Adultos
Basal |
94 |
96 |
93 |
88 |
79 |
90 |
86 |
89 |
81 |
90 |
60min |
198 |
191 |
190 |
185 |
184 |
159 |
170 |
197 |
183 |
178 |
Responder a las siguientes cuestiones:
Continuando con el estudio de la asimetría en la hoja de la encina, (Ejercicio guiado 1) se ha detectado la presencia de Agallas en Encina (pequeñas agallas en el envés de una hoja de encina causadas por el díptero Dryomyia lichtensteini) tanto en las zonas secas como en las zonas con mayor precipitación.
En las dos zonas muy secas (Ladihonda y Fazares) se pretende comprobar si determinado tratamiento, aplicado durante un mes, ayuda a reducir la presencia de dichas agallas. Para ello, se realiza un estudio a 10 encinas, en las que se selecciona aleatoriamente 10 hojas y se registra el promedio de agallas presentes antes del tratamiento y después del tratamiento (se supone normalidad). Los resultados se muestran a continuación:
| Antes | 10,5 |
9,7 |
13,3 |
7,5 |
12,8 |
15,2 |
11,2 |
10,7 |
5,2 |
18,9 |
| Después | 11,2 |
7,8 |
9,2 |
3,4 |
8,9 |
10,8 |
11,4 |
8,5 |
6,2 |
11,1 |
| . |
Número medio de agallas |
||
| SO2 | Bajo |
Normal |
Alto |
| Bajo | 3 |
10 |
7 |
| Normal | 5 |
9 |
6 |
| Alto | 8 |
6 |
6 |
Se quiere estudiar si el número de bacterias que aparecen en un determinado cultivo al cabo de una semana es aleatorio o por el contrario habría que suponer que hay algo en el cultivo que propicia el desarrollo de tales bacterias. Para ello, se sometió el cultivo a 10 semanas de observación y se obtuvieron los siguientes resultados: 498, 490, 510, 505, 495, 496, 497, 501, 502, 520.
En un determinado hospital se están realizando diversos estudios comparativos, con el objetivo de estudiar el número pacientes que llegan, durante una semana al hospital, para ser diagnosticado y el número de enfermos con un tipo de carcinoma que reciben una determinada terapia. Para ello se dispone de la siguiente información:
Sexo |
H |
H |
H |
H |
H |
M |
H |
M |
H |
M |
H |
H |
M |
M |
M |
M |
H |
H |
M |
M |
Terapia |
NO |
SI |
NO |
SI |
NO |
SI |
NO |
SI |
SI |
SI |
NO |
SI |
NO |
SI |
SI |
NO |
SI |
NO |
SI |
NO |
Se pide, a un nivel de confianza del 5%:
En una unidad de investigación hospitalaria se está realizando un estudio para conocer si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad. Para ello se realizó un test oral de glucosa a dos muestras de pacientes sanos, unos jóvenes y otros adultos. El test consistió en medir el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) de 100 grs. de glucosa y a los 60 minutos de la toma. Los resultados fueron los siguientes
Jóvenes
Basal |
90 |
82 |
80 |
75 |
74 |
97 |
76 |
89 |
83 |
77 |
60min |
136 |
151 |
148 |
138 |
141 |
157 |
154 |
156 |
147 |
141 |
Adultos
Basal |
94 |
96 |
93 |
88 |
79 |
90 |
86 |
89 |
81 |
90 |
60min |
198 |
191 |
190 |
185 |
184 |
159 |
170 |
197 |
183 |
178 |
Responder a las siguientes cuestiones:
a) ¿Los niveles de glucosa en sangre en el momento de la ingestión (nivel basal) siguen una distribución normal en las dos poblaciones?
Se debe contrastar si la distribución de nivel de glucosa para los jóvenes y los adultos en el momento de la ingestión (nivel basal) sigue una distribución normal. Para ello, una vez introducidos los datos en SPSS, se contrasta la normalidad mediante el contraste de Kolmogorov-Smirnov.
Se selecciona, en el menú principal, Analizar/Pruebas no paramétricas/Cuadros de dáologo antiguos/K-S de 1 muestra... y se obtiene la siguiente salida
De los resultados deducimos
b) ¿Se puede admitir que el nivel medio de glucosa en sangre en el momento de la ingestión en los jóvenes es menor que 85?
Este apartado se resuelve mediante un contraste unilateral (en este caso de cola a la izquierda) para la media de una población normal. Para ello, se selecciona Analizar/Comparar medias/Prueba T de una muestra...
SPSS muestra la siguiente salida:
En esta tabla se observa que el valor del estadístico (t = -1.128) deja a la derecha un p-valor (Sig. (bilateral)) de 0.289. Para resolver el contraste de una cola el p-valor asociado al contraste será la mitad del p-valor mostrado en la tabla. Es decir el p-valor es 0.1445 mayor que el nivel de significación 0.05. Por lo tanto, no se debe rechazar la hipótesis nula y concluimos que el nivel basal medio de glucosa en los jóvenes no es menor que 85.
c) ¿Se detecta una variación significativa del nivel de glucosa en sangre en cada grupo?
Se pretende comprobar si, como muestran los datos, los niveles de glucosa en sangre son distintos para cada grupo en el momento de la ingestión y a los 60 minutos. Se realiza un contraste de medias de variables normales en muestras apareadas. Para realizar este contraste mediante SPSS se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para muestras relacionadas... y se obtiene la siguiente salida
De los resultados deducimos
d) Estudiar donde es mayor la concentración de glucosa en sangre:
d1) ¿La concentración de glucosa es mayor en adultos que en jóvenes?
Se trata de un contraste unilateral (de cola a la izquierda) para la diferencia de medias de dos muestras independientes, H0: µ1 >= µ2 (La concentración media de glucosa es menor o igual en adultos que en jóvenes) frente a la alternativa H1: µ1 < µ2 (la concentración media de glucosa es mayor en adultos que en jóvenes). Para resolverlo mediante SPSS se selecciona, en el menú principal: Analizar/Comparar medias/Prueba T para muestras independientes... y se obtiene la siguiente salida
De los resultados deducimos
d2) ¿La concentración de glucosa es mayor a los 60 minutos en adultos que en jóvenes?
Se trata de un contraste unilateral (de cola a la izquierda) para la diferencia de medias de dos muestras independientes, H0: µ1 >= µ2 (La concentración media de glucosa es menor o igual a los 60 minutos en adultos que en jóvenes) frente a la alternativa H1: µ1 < µ2 (la concentración media de glucosa es mayor a los 60 minutos en adultos que en jóvenes). Para resolverlo mediante SPSS se selecciona, en el menú principal: Analizar/Comparar medias/Prueba T para muestras independientes y se obtiene la siguiente salida
De los resultados deducimos
d3) ¿La concentración de glucosa es mayor en el momento de la ingestión en adultos que en jóvenes?
Se trata de un contraste unilateral (de cola a la izquierda) para la diferencia de medias de dos muestras independientes, H0: µ1 >= µ2 (La concentración media de glucosa en el momento de la ingestión es menor o igual en adultos que en jóvenes) frente a la alternativa H1: µ1 < µ2 (la concentración media de glucosa en el momento de la ingestión es mayor en adultos que en jóvenes). Para resolverlo mediante SPSS se selecciona, en el menú principal: Analizar/Comparar medias/Prueba T para muestras independientes... y se obtiene la siguiente salida
De los resultados deducimos
e) A un nivel de significación del 5%,
e1) ¿Es representativo el ajuste lineal, en los jóvenes, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?
Para comprobar si es representativo, mediante SPSS, el ajuste lineal pedido se selecciona en el menú principal, Analizar/Regresión/Lineal... y se analiza la siguiente salida de SPSS
El p-valor igual a 0,216 nos indica que no se debe rechazar la hipótesis nula de que el coeficiente de regresión es 0 y por tanto no se debe predecir el nivel basal de glucosa de los jóvenes a partir del nivel a los 60 minutos.
Para obtener la expresión del modelo se selecciona la siguiente salida de SPSS
La expresión del modelo es: y = 19.609 + 0.427x, donde
y: nivel basal de glucosa de los jóvenes
x: nivel de glucosa de los jóvenes a los 60 minutos
Para saber cuánto explica el modelo la siguiente tabla muestra el coeficiente de determinación R2 = 0,184, este valor indica que el modelo explica el 18,4 % de la variación del nivel basal de glucosa en los jóvenes.
e2) A un nivel de significación del 5% ¿Es representativo el ajuste lineal, en los adultos, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos en los adultos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?
Para comprobar si es representativo, mediante SPSS, el ajuste lineal pedido se selecciona en el menú principal, Analizar/Regresión/Lineal... y se analiza la siguiente salida de SPSS
El p-valor igual a 0,450 nos indica que no se debe rechazar la hipótesis nula de que el coeficiente de regresión es 0 y por tanto no se debe predecir el nivel basal de glucosa de los adultos a partir del nivel a los 60 minutos.
Para obtener la expresión del modelo se selecciona la siguiente salida de SPSS
La ecuación del modelo está dada por: y = 66.268 + 0.122x, donde
y: nivel basal de glucosa de los adultos
x: nivel de glucosa de los adultos a los 60 minutos
¿Cuánto explica el modelo?
El coeficiente de determinación R2 = 0,073 indica que el modelo explica el 7,3 % de la variación del nivel basal de glucosa en los adultos.
e3) A un nivel de significación del 5% ¿Es representativo el ajuste lineal entre los jóvenes y los adultos?
Se selecciona, en el menú principal, Analizar/Regresión/Lineal... y se analiza la siguiente salida de SPSS
El p-valor menor que 0,001 nos indica que se debe rechazar la hipótesis nula de que el coeficiente de regresión es 0 y por tanto se puede predecir el nivel de glucosa de los adultos a partir del nivel de glucosa de los jóvenes.
Para obtener la expresión del modelo se considera la siguiente salida de SPSS
La expresión del modelo es: y = -23.367 + 1.391x, donde
y: nivel de glucosa de los adultos
x: nivel de glucosa de los jóvenes
¿Cuánto explica el modelo?
El coeficiente de determinación R2 = 0,91 indica que el modelo explica el 91 % de la variación del nivel de glucosa en los adultos. El ajuste realizado es bueno.
Continuando con el estudio de la asimetría en la hoja de la encina, (Ejercicio guiado 1) se ha detectado la presencia de Agallas en Encina (pequeñas agallas en el envés de una hoja de encina causadas por el díptero Dryomyia lichtensteini) tanto en las zonas secas como en las zonas con mayor precipitación.
| Antes | 10,5 |
9,7 |
13,3 |
7,5 |
12,8 |
15,2 |
11,2 |
10,7 |
5,2 |
18,9 |
| Después | 11,2 |
7,8 |
9,2 |
3,4 |
8,9 |
10,8 |
11,4 |
8,5 |
6,2 |
11,1 |
| . |
Número medio de agallas |
||
| SO2 | Bajo |
Normal |
Alto |
| Bajo | 3 |
10 |
7 |
| Normal | 5 |
9 |
6 |
| Alto | 8 |
6 |
6 |
a) En las dos zonas muy secas (Ladihonda y Fazares) se pretende comprobar si determinado tratamiento, aplicado durante un mes, ayuda a reducir la presencia de Agallas en Encina. Para ello, se realiza un estudio a 10 encinas, en las que se seleccionan aleatoriamente 10 hojas y se registra el promedio de agallas presentes antes del tratamiento y después del tratamiento
Para comprobar la efectividad del tratamiento aplicado de la forma especificada (antes-después) se realiza un contraste unilateral (de cola a la derecha) de diferencias de medias de variables normales en muestras apareadas, H0: µ1 <= µ2 (El número medios de agallas antes del tratamiento es menor o igual que después de haberlo aplicado) frente a la alternativa H1: µ1> µ2; (El número medios de agallas antes del tratamiento es mayor que después de haberlo aplicado). Para ello, se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para muestras relacionadas. Se obtiene la siguiente pantalla
texp = 3.031 y el p-valor asociado será la mitad del obtenido para el contraste bilateral, es decir, p-valor < 0,007, que a un nivel de significación del 5 % se debe rechazar la hipótesis nula, por lo tanto el tratamiento durante un mes ayuda a reducir la presencia de Agallas en Encina.
b) Se quiere estudiar la asociación entre el nivel de dióxido de sulfúrico del aire y el número medio de Agallas en Encina en la zona de los árboles de Molinillo.
Para estudiar la asociación entre el promedio de Agallas en Encina y el nivel de S02 se realiza un contraste de independencia mediante el contrate no-paramétrico de Chi-cuadrado. Para ello se elige, en el menú principal, Analizar/Estadísticos descriptivos/Tablas de contingencia... Se muestra la siguiente salida
El p-valor es igual a 0.475 por lo que no se puede rechazar la hipótesis de independencia.
Se quiere estudiar si el número de bacterias que aparecen en un determinado cultivo al cabo de una semana es aleatorio o por el contrario habría que suponer que hay algo en el cultivo que propicia el desarrollo de tales bacterias. Para ello, se sometió el cultivo a 10 semanas de observación y se obtuvieron los siguientes resultados: 498, 490, 510, 505, 495, 496, 497, 501, 502, 520.
Para comprobar si el número de bacterias que aparecen en un determinado cultivo al cabo de una semana es aleatorio, se realiza un contraste no-paramétrico de aleatoriedad. (H0: Hay aleatoriedad frente a H1: No hay aleatoriedad). Para ello se selecciona, en el menú principal, Analizar/Pruebas no paramétricas/Cuadros de diálogo antiguos/Rachas... Se obtiene la siguiente salida
Mediante la Prueba de rachas se obtiene el valor de Zexp (-1.006), dicho valor deja a la derecha un área de 0.314, mayor que el nivel de significación 0.05, por lo tanto no debe rechazarse la hipótesis nula de aleatoriedad.
En un determinado hospital se están realizando diversos estudios comparativos, con el objetivo de estudiar el número pacientes que llegan, durante una semana al hospital, para ser diagnosticado y el número de enfermos con un tipo de carcinoma que reciben una determinada terapia. Para ello se dispone de la siguiente información:
Sexo |
H |
H |
H |
H |
H |
M |
H |
M |
H |
M |
H |
H |
M |
M |
M |
M |
H |
H |
M |
M |
Terapia |
NO |
SI |
NO |
SI |
NO |
SI |
NO |
SI |
SI |
SI |
NO |
SI |
NO |
SI |
SI |
NO |
SI |
NO |
SI |
NO |
Se pide, a un nivel de confianza del 5%:
a) Estudiar si el porcentaje de hombres que llegan, durante una semana al hospital, para ser diagnosticado es del 53%.
Para resolver este apartado, se realiza un contraste para la
proporción de una distribución Binomial. Es decir, se quiere contrastar H0:
p = 0.52 frente a H1: p <> 0.52. Siendo p la proporción de
hombres.
Para obtener una Prueba binomial, mediante SPSS, se selecciona en el
menú principal, Analizar/Pruebas no paramétricas/Cuadros de diálogo antiguos/Binomial
La pantalla de resultados de este procedimiento se presenta en la tabla de la Prueba binomial
Se observa que la proporción muestral de hombres es 0.55 y que el p-valor (Sig. exacta (unilateral)) es de 0.483, por lo tanto no se debe rechazar la hipótesis nula.
b) Comparar la proporción de mujeres con carcinoma que reciben la terapia
Para evaluar si existen diferencias significativas entre la proporción muestral de mujeres que reciben la terapia y la proporción muestral que no la reciben, se realiza un contraste bilateral con las siguientes hipótesis estadísticas: H0: p1 = p2 (proporciones iguales) frente a H1: p1 <>p2 (proporciones distintas).
El contraste de comparación de dos proporciones es un caso particular del contraste de homogeneidad de dos muestras de una variable cualitativa cuando ésta sólo presenta dos modalidades. (Ver Contrastes de hipótesis para dos proporciones independientes. Muestras grandes en la “Introducción” de la Práctica 6). Por ello, el procedimiento que vamos a realizar es el análisis de una tabla de contingencia 2x2.
Para obtener el procedimiento Tablas de contingencia se elige en los
menús Analizar/Estadísticos descriptivos/Tablas de contingencia...
La tabla de contingencia muestra la tabla de frecuencias conjuntas. En cada casilla aparece, además de la frecuencia observada, el porcentaje que ésta representa sobre el total de la fila. Así las proporciones muestrales que vamos a comparar son: 3/9 y 6/11.
La siguiente salida de SPSS muestra la tabla Pruebas de chi-cuadrado
Esta tabla presenta los resultados de cinco estadísticos para la comparación de ambas proporciones. Generalmente, en el caso de muestras grandes se elige el estadístico Corrección por continuidad. Dicho estadístico calcula el estadístico Chi-cuadrado con la corrección por continuidad de Yates. En el caso de muestras pequeñas, se decide a partir del Estadístico exacto de Fisher. El valor p de la prueba exacta de Fisher es 0.406 (Sig. exacta (bilateral)). Comparando este valor con el nivel de significación establecido del 5% se concluye que no se debe rechazar la hipótesis nula, es decir las diferencias observadas entre ambas proporciones no son estadísticamente significativas.