Ejercicios Propuestos

Ejercicio Propuesto 1

En una unidad de investigación hospitalaria se está realizando un estudio para conocer si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad. Para ello se realizó un test oral de glucosa a dos muestras de pacientes sanos, unos jóvenes y otros adultos. El test consistió en medir el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) de 100 grs. de glucosa y a los 60 minutos de la toma. Los resultados fueron los siguientes

Jóvenes

Basal
90
82
80
75
74
97
76
89
83
77
60min
136
151
148
138
141
157
154
156
147
141

Adultos

Basal
94
96
93
88
79
90
86
89
81
90
60min
198
191
190
185
184
159
170
197
183
178

Responder a las siguientes cuestiones:

  1. ¿Los niveles de glucosa en sangre en el momento de la ingestión (nivel basal) siguen una distribución normal en las dos poblaciones?
  2. ¿Se puede admitir que el nivel medio de glucosa en sangre en el momento de la ingestión en los jóvenes es menor que 85?
  3. ¿Se detecta una variación significativa del nivel de glucosa en sangre en cada grupo?
  4. Estudiar donde es mayor la concentración de glucosa en sangre:
    d1)
    ¿La concentración de glucosa es mayor en adultos que en jóvenes?
    d2) ¿La concentración de glucosa es mayor a los 60 minutos en adultos que en jóvenes?
    d3) ¿La concentración de glucosa es mayor en el momento de la ingestión en adultos que en jóvenes?
  5. A un nivel de significación del 5%,
    e1) ¿Es representativo el ajuste lineal, en los jóvenes, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?
    e2) ¿Es representativo el ajuste lineal, en los adultos, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?
    e3) ¿Es representativo el ajuste lineal entre los jóvenes y los adultos?


Ejercicio Propuesto 2

Continuando con el estudio de la asimetría en la hoja de la encina, (Ejercicio guiado 1) se ha detectado la presencia de Agallas en Encina (pequeñas agallas en el envés de una hoja de encina causadas por el díptero Dryomyia lichtensteini) tanto en las zonas secas como en las zonas con mayor precipitación.

  1. En las dos zonas muy secas (Ladihonda y Fazares) se pretende comprobar si determinado tratamiento, aplicado durante un mes, ayuda a reducir la presencia de dichas agallas. Para ello, se realiza un estudio a 10 encinas, en las que se selecciona aleatoriamente 10 hojas y se registra el promedio de agallas presentes antes del tratamiento y después del tratamiento (se supone normalidad). Los resultados se muestran a continuación:

  2. Antes
    10,5
    9,7
    13,3
    7,5
    12,8
    15,2
    11,2
    10,7
    5,2
    18,9
    Después
    11,2
    7,8
    9,2
    3,4
    8,9
    10,8
    11,4
    8,5
    6,2
    11,1

  3. Se quiere estudiar la asociación entre el nivel de dióxido de sulfúrico del aire y el número medio de Agallas en Encina en las zonas de los árboles de Molinillo. Se elige una muestra de 10 zonas de las que se sabe que tienen una alta concentración de dióxido de sulfúrico, 10 zonas que se sabe que tienen un nivel normal y 10 zonas que tienen una baja concentración. Dentro de cada zona se seleccionan aleatoriamente 20 encinas y se determina para cada encina el promedio de agallas en las hojas. Sobre esta base se clasifica cada encina según tenga un recuento bajo, normal o alto de agallas. Se obtienen los datos que se muestran en la siguiente tabla
  4. .
    Número medio de agallas
    SO2
    Bajo
    Normal
    Alto
    Bajo
    3
    10
    7
    Normal
    5
    9
    6
    Alto
    8
    6
    6


Ejercicio Propuesto 3

Se quiere estudiar si el número de bacterias que aparecen en un determinado cultivo al cabo de una semana es aleatorio o por el contrario habría que suponer que hay algo en el cultivo que propicia el desarrollo de tales bacterias. Para ello, se sometió el cultivo a 10 semanas de observación y se obtuvieron los siguientes resultados: 498, 490, 510, 505, 495, 496, 497, 501, 502, 520.


Ejercicio Propuesto 4

En un determinado hospital se están realizando diversos estudios comparativos, con el objetivo de estudiar el número pacientes que llegan, durante una semana al hospital, para ser diagnosticado y el número de enfermos con un tipo de carcinoma que reciben una determinada terapia. Para ello se dispone de la siguiente información:

Sexo
H
H
H
H
H
M
H
M
H
M
H
H
M
M
M
M
H
H
M
M
Terapia
NO
SI
NO
SI
NO
SI
NO
SI
SI
SI
NO
SI
NO
SI
SI
NO
SI
NO
SI
NO

Se pide, a un nivel de confianza del 5%:

  1. Estudiar si el porcentaje de hombres que llegan, durante una semana al hospital, para ser diagnosticado es del 52%.
  2. Comparar la proporción de mujeres con carcinoma que reciben o no reciben la terapia.

Ejercicio Propuesto 1

En una unidad de investigación hospitalaria se está realizando un estudio para conocer si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad. Para ello se realizó un test oral de glucosa a dos muestras de pacientes sanos, unos jóvenes y otros adultos. El test consistió en medir el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) de 100 grs. de glucosa y a los 60 minutos de la toma. Los resultados fueron los siguientes

Jóvenes

Basal
90
82
80
75
74
97
76
89
83
77
60min
136
151
148
138
141
157
154
156
147
141

Adultos

Basal
94
96
93
88
79
90
86
89
81
90
60min
198
191
190
185
184
159
170
197
183
178

Responder a las siguientes cuestiones:

  1. ¿Los niveles de glucosa en sangre en el momento de la ingestión (nivel basal) siguen una distribución normal en las dos poblaciones?
  2. ¿Se puede admitir que el nivel medio de glucosa en sangre en el momento de la ingestión en los jóvenes es menor que 85?
  3. ¿Se detecta una variación significativa del nivel de glucosa en sangre en cada grupo?
  4. Estudiar donde es mayor la concentración de glucosa en sangre:
    d1. ¿La concentración de glucosa es mayor en adultos que en jóvenes?
    d2. ¿La concentración de glucosa es mayor a los 60 minutos en adultos que en jóvenes?
    d3. ¿La concentración de glucosa es mayor en el momento de la ingestión en adultos que en jóvenes?
  5. A un nivel de significación del 5%,
  6. e1. ¿Es representativo el ajuste lineal, en los jóvenes, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?
    e2. ¿Es representativo el ajuste lineal, en los adultos, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?
    e3. ¿Es representativo el ajuste lineal entre los jóvenes y los adultos?


Solución:

a) ¿Los niveles de glucosa en sangre en el momento de la ingestión (nivel basal) siguen una distribución normal en las dos poblaciones?

Se debe contrastar si la distribución de nivel de glucosa para los jóvenes y los adultos en el momento de la ingestión (nivel basal) sigue una distribución normal. Para ello, una vez introducidos los datos en SPSS, se contrasta la normalidad mediante el contraste de Kolmogorov-Smirnov.

Se selecciona, en el menú principal, Analizar/Pruebas no paramétricas/Cuadros de dáologo antiguos/K-S de 1 muestra... y se obtiene la siguiente salida

De los resultados deducimos

b) ¿Se puede admitir que el nivel medio de glucosa en sangre en el momento de la ingestión en los jóvenes es menor que 85?

Este apartado se resuelve mediante un contraste unilateral (en este caso de cola a la izquierda) para la media de una población normal. Para ello, se selecciona Analizar/Comparar medias/Prueba T de una muestra...

SPSS muestra la siguiente salida:

En esta tabla se observa que el valor del estadístico (t = -1.128) deja a la derecha un p-valor (Sig. (bilateral)) de 0.289. Para resolver el contraste de una cola el p-valor asociado al contraste será la mitad del p-valor mostrado en la tabla. Es decir el p-valor es 0.1445 mayor que el nivel de significación 0.05. Por lo tanto, no se debe rechazar la hipótesis nula y concluimos que el nivel basal medio de glucosa en los jóvenes no es menor que 85.

c) ¿Se detecta una variación significativa del nivel de glucosa en sangre en cada grupo?

Se pretende comprobar si, como muestran los datos, los niveles de glucosa en sangre son distintos para cada grupo en el momento de la ingestión y a los 60 minutos. Se realiza un contraste de medias de variables normales en muestras apareadas. Para realizar este contraste mediante SPSS se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para muestras relacionadas... y se obtiene la siguiente salida

De los resultados deducimos

d) Estudiar donde es mayor la concentración de glucosa en sangre:

d1) ¿La concentración de glucosa es mayor en adultos que en jóvenes?

Se trata de un contraste unilateral (de cola a la izquierda) para la diferencia de medias de dos muestras independientes, H0: µ1 >= µ2 (La concentración media de glucosa es menor o igual en adultos que en jóvenes) frente a la alternativa H1: µ1 < µ2 (la concentración media de glucosa es mayor en adultos que en jóvenes). Para resolverlo mediante SPSS se selecciona, en el menú principal: Analizar/Comparar medias/Prueba T para muestras independientes... y se obtiene la siguiente salida

De los resultados deducimos

d2) ¿La concentración de glucosa es mayor a los 60 minutos en adultos que en jóvenes?

Se trata de un contraste unilateral (de cola a la izquierda) para la diferencia de medias de dos muestras independientes, H0: µ1 >= µ2 (La concentración media de glucosa es menor o igual a los 60 minutos en adultos que en jóvenes) frente a la alternativa H1: µ1 < µ2 (la concentración media de glucosa es mayor a los 60 minutos en adultos que en jóvenes). Para resolverlo mediante SPSS se selecciona, en el menú principal: Analizar/Comparar medias/Prueba T para muestras independientes y se obtiene la siguiente salida

 

De los resultados deducimos

d3) ¿La concentración de glucosa es mayor en el momento de la ingestión en adultos que en jóvenes?

Se trata de un contraste unilateral (de cola a la izquierda) para la diferencia de medias de dos muestras independientes, H0: µ1 >= µ2 (La concentración media de glucosa en el momento de la ingestión es menor o igual en adultos que en jóvenes) frente a la alternativa H1: µ1 < µ2 (la concentración media de glucosa en el momento de la ingestión es mayor en adultos que en jóvenes). Para resolverlo mediante SPSS se selecciona, en el menú principal: Analizar/Comparar medias/Prueba T para muestras independientes... y se obtiene la siguiente salida

De los resultados deducimos

e) A un nivel de significación del 5%,

e1) ¿Es representativo el ajuste lineal, en los jóvenes, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?

Para comprobar si es representativo, mediante SPSS, el ajuste lineal pedido se selecciona en el menú principal, Analizar/Regresión/Lineal... y se analiza la siguiente salida de SPSS

El p-valor igual a 0,216 nos indica que no se debe rechazar la hipótesis nula de que el coeficiente de regresión es 0 y por tanto no se debe predecir el nivel basal de glucosa de los jóvenes a partir del nivel a los 60 minutos.

Para obtener la expresión del modelo se selecciona la siguiente salida de SPSS

La expresión del modelo es: y = 19.609 + 0.427x, donde
y: nivel basal de glucosa de los jóvenes
x: nivel de glucosa de los jóvenes a los 60 minutos

Para saber cuánto explica el modelo la siguiente tabla muestra el coeficiente de determinación R2 = 0,184, este valor indica que el modelo explica el 18,4 % de la variación del nivel basal de glucosa en los jóvenes.

e2) A un nivel de significación del 5% ¿Es representativo el ajuste lineal, en los adultos, entre el nivel de glucosa en sangre en el momento de la ingestión (nivel basal) y a los 60 minutos en los adultos? ¿Cuál sería la expresión del modelo?¿Cuánto explica el modelo?

Para comprobar si es representativo, mediante SPSS, el ajuste lineal pedido se selecciona en el menú principal, Analizar/Regresión/Lineal... y se analiza la siguiente salida de SPSS

El p-valor igual a 0,450 nos indica que no se debe rechazar la hipótesis nula de que el coeficiente de regresión es 0 y por tanto no se debe predecir el nivel basal de glucosa de los adultos a partir del nivel a los 60 minutos.

Para obtener la expresión del modelo se selecciona la siguiente salida de SPSS

La ecuación del modelo está dada por: y = 66.268 + 0.122x, donde
y: nivel basal de glucosa de los adultos
x: nivel de glucosa de los adultos a los 60 minutos

¿Cuánto explica el modelo?

El coeficiente de determinación R2 = 0,073 indica que el modelo explica el 7,3 % de la variación del nivel basal de glucosa en los adultos.

e3) A un nivel de significación del 5% ¿Es representativo el ajuste lineal entre los jóvenes y los adultos?

Se selecciona, en el menú principal, Analizar/Regresión/Lineal... y se analiza la siguiente salida de SPSS

El p-valor menor que 0,001 nos indica que se debe rechazar la hipótesis nula de que el coeficiente de regresión es 0 y por tanto se puede predecir el nivel de glucosa de los adultos a partir del nivel de glucosa de los jóvenes.

Para obtener la expresión del modelo se considera la siguiente salida de SPSS

La expresión del modelo es: y = -23.367 + 1.391x, donde
y: nivel de glucosa de los adultos
x: nivel de glucosa de los jóvenes

¿Cuánto explica el modelo?

El coeficiente de determinación R2 = 0,91 indica que el modelo explica el 91 % de la variación del nivel de glucosa en los adultos. El ajuste realizado es bueno.


Ejercicio Propuesto 2

Continuando con el estudio de la asimetría en la hoja de la encina, (Ejercicio guiado 1) se ha detectado la presencia de Agallas en Encina (pequeñas agallas en el envés de una hoja de encina causadas por el díptero Dryomyia lichtensteini) tanto en las zonas secas como en las zonas con mayor precipitación.

  1. En las dos zonas muy secas (Ladihonda y Fazares) se pretende comprobar si determinado tratamiento, aplicado durante un mes, ayuda a reducir la presencia de dichas agallas. Para ello, se realiza un estudio a 10 encinas, en las que se selecciona aleatoriamente 10 hojas y se registra el promedio de agallas presentes antes del tratamiento y después del tratamiento (se supone normalidad). Los resultados se muestran a continuación:
  2. Antes
    10,5
    9,7
    13,3
    7,5
    12,8
    15,2
    11,2
    10,7
    5,2
    18,9
    Después
    11,2
    7,8
    9,2
    3,4
    8,9
    10,8
    11,4
    8,5
    6,2
    11,1

  3. Se quiere estudiar la asociación entre el nivel de dióxido de sulfúrico del aire y el número medio de Agallas en Encina en las zonas de los árboles de Molinillo. Se elige una muestra de 10 zonas de las que se sabe que tienen una alta concentración de dióxido de sulfúrico, 10 zonas que se sabe que tienen un nivel normal y 10 zonas que tienen una baja concentración. Dentro de cada zona se seleccionan aleatoriamente 20 encinas y se determina para cada encina el promedio de agallas en las hojas. Sobre esta base se clasifica cada encina según tenga un recuento bajo, normal o alto de agallas. Se obtienen los datos que se muestran en la siguiente tabla
  4. .
    Número medio de agallas
    SO2
    Bajo
    Normal
    Alto
    Bajo
    3
    10
    7
    Normal
    5
    9
    6
    Alto
    8
    6
    6


Solución:

a) En las dos zonas muy secas (Ladihonda y Fazares) se pretende comprobar si determinado tratamiento, aplicado durante un mes, ayuda a reducir la presencia de Agallas en Encina. Para ello, se realiza un estudio a 10 encinas, en las que se seleccionan aleatoriamente 10 hojas y se registra el promedio de agallas presentes antes del tratamiento y después del tratamiento

Para comprobar la efectividad del tratamiento aplicado de la forma especificada (antes-después) se realiza un contraste unilateral (de cola a la derecha) de diferencias de medias de variables normales en muestras apareadas, H0: µ1 <= µ2 (El número medios de agallas antes del tratamiento es menor o igual que después de haberlo aplicado) frente a la alternativa H1: µ1> µ2; (El número medios de agallas antes del tratamiento es mayor que después de haberlo aplicado). Para ello, se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para muestras relacionadas. Se obtiene la siguiente pantalla

texp = 3.031 y el p-valor asociado será la mitad del obtenido para el contraste bilateral, es decir, p-valor < 0,007, que a un nivel de significación del 5 % se debe rechazar la hipótesis nula, por lo tanto el tratamiento durante un mes ayuda a reducir la presencia de Agallas en Encina.

b) Se quiere estudiar la asociación entre el nivel de dióxido de sulfúrico del aire y el número medio de Agallas en Encina en la zona de los árboles de Molinillo.

Para estudiar la asociación entre el promedio de Agallas en Encina y el nivel de S02 se realiza un contraste de independencia mediante el contrate no-paramétrico de Chi-cuadrado. Para ello se elige, en el menú principal, Analizar/Estadísticos descriptivos/Tablas de contingencia... Se muestra la siguiente salida

El p-valor es igual a 0.475 por lo que no se puede rechazar la hipótesis de independencia.


Ejercicio Propuesto 3

Se quiere estudiar si el número de bacterias que aparecen en un determinado cultivo al cabo de una semana es aleatorio o por el contrario habría que suponer que hay algo en el cultivo que propicia el desarrollo de tales bacterias. Para ello, se sometió el cultivo a 10 semanas de observación y se obtuvieron los siguientes resultados: 498, 490, 510, 505, 495, 496, 497, 501, 502, 520.


Solución:

Para comprobar si el número de bacterias que aparecen en un determinado cultivo al cabo de una semana es aleatorio, se realiza un contraste no-paramétrico de aleatoriedad. (H0: Hay aleatoriedad frente a H1: No hay aleatoriedad). Para ello se selecciona, en el menú principal, Analizar/Pruebas no paramétricas/Cuadros de diálogo antiguos/Rachas... Se obtiene la siguiente salida

Mediante la Prueba de rachas se obtiene el valor de Zexp (-1.006), dicho valor deja a la derecha un área de 0.314, mayor que el nivel de significación 0.05, por lo tanto no debe rechazarse la hipótesis nula de aleatoriedad.


Ejercicio Propuesto 4

En un determinado hospital se están realizando diversos estudios comparativos, con el objetivo de estudiar el número pacientes que llegan, durante una semana al hospital, para ser diagnosticado y el número de enfermos con un tipo de carcinoma que reciben una determinada terapia. Para ello se dispone de la siguiente información:

Sexo
H
H
H
H
H
M
H
M
H
M
H
H
M
M
M
M
H
H
M
M
Terapia
NO
SI
NO
SI
NO
SI
NO
SI
SI
SI
NO
SI
NO
SI
SI
NO
SI
NO
SI
NO

Se pide, a un nivel de confianza del 5%:

  1. Estudiar si el porcentaje de hombres que llegan, durante una semana al hospital, para ser diagnosticado es del 52%.
  2. Comparar la proporción de mujeres con carcinoma que reciben o no reciben la terapia.

Solución:

a) Estudiar si el porcentaje de hombres que llegan, durante una semana al hospital, para ser diagnosticado es del 53%.

Para resolver este apartado, se realiza un contraste para la proporción de una distribución Binomial. Es decir, se quiere contrastar H0: p = 0.52 frente a H1: p <> 0.52. Siendo p la proporción de hombres.
Para obtener una Prueba binomial, mediante SPSS, se selecciona en el menú principal, Analizar/Pruebas no paramétricas/Cuadros de diálogo antiguos/Binomial

La pantalla de resultados de este procedimiento se presenta en la tabla de la Prueba binomial

Se observa que la proporción muestral de hombres es 0.55 y que el p-valor (Sig. exacta (unilateral)) es de 0.483, por lo tanto no se debe rechazar la hipótesis nula.

b) Comparar la proporción de mujeres con carcinoma que reciben la terapia

Para evaluar si existen diferencias significativas entre la proporción muestral de mujeres que reciben la terapia y la proporción muestral que no la reciben, se realiza un contraste bilateral con las siguientes hipótesis estadísticas: H0: p1 = p2 (proporciones iguales) frente a H1: p1 <>p2 (proporciones distintas).

El contraste de comparación de dos proporciones es un caso particular del contraste de homogeneidad de dos muestras de una variable cualitativa cuando ésta sólo presenta dos modalidades. (Ver Contrastes de hipótesis para dos proporciones independientes. Muestras grandes en la “Introducción” de la Práctica 6). Por ello, el procedimiento que vamos a realizar es el análisis de una tabla de contingencia 2x2.
Para obtener el procedimiento Tablas de contingencia se elige en los menús Analizar/Estadísticos descriptivos/Tablas de contingencia...

La tabla de contingencia muestra la tabla de frecuencias conjuntas. En cada casilla aparece, además de la frecuencia observada, el porcentaje que ésta representa sobre el total de la fila. Así las proporciones muestrales que vamos a comparar son: 3/9 y 6/11.

La siguiente salida de SPSS muestra la tabla Pruebas de chi-cuadrado

Esta tabla presenta los resultados de cinco estadísticos para la comparación de ambas proporciones. Generalmente, en el caso de muestras grandes se elige el estadístico Corrección por continuidad. Dicho estadístico calcula el estadístico Chi-cuadrado con la corrección por continuidad de Yates. En el caso de muestras pequeñas, se decide a partir del Estadístico exacto de Fisher. El valor p de la prueba exacta de Fisher es 0.406 (Sig. exacta (bilateral)). Comparando este valor con el nivel de significación establecido del 5% se concluye que no se debe rechazar la hipótesis nula, es decir las diferencias observadas entre ambas proporciones no son estadísticamente significativas.