DESARROLLO DE LOS CONTENIDOS.
          • Definiciones.-
          • Distribución de frecuencias.
          • Tablas estadísticas.
          • Representaciones gráficas.
          • Medidas de posición.
          • Medidas de dispersión.





    DEFINICIONES
        Lo primero que vamos a hacer es introducir una serie de definiciones que nos permitan hablar con claridad y precisión.
          Población.-
        Es el conjunto de los elementos sobre el cual realizamos nuestro estudio. Es un conjunto de elementos con características comunes, que puede ser finito o infinito. El tamaño de la población se nota con la letra N.
          Ejemplo:
        La población en las tres actividades motivadoras es el conjunto de todos los alumnos de la clase. En las dos primeras actividades podemos considerar aisladamente el conjunto de los alumnos como una población sobre la que realizar un estudio y el de las alumnas como otra población distinta.
          Muestra.-
        Es un subconjunto de la población. El número de elementos se llama tamaño de la muestra.
          Ejemplo:
        En las dos primeras actividades podemos considerar el conjunto de alumnos de la clase como una muestra y el conjunto de las alumnas como otra. En la primera actividad el tamaño de la muestra de los alumnos es 22 y el tamaño de la muestra de las alumnas es 28.
          Individuo.-
        Cualquier elemento de la población o de una muestra, en nuestras actividades un individuo es un alumno.
          Carácter.-
        Llamaremos carácter a cada una de las propiedades comunes a cada individuo de una población, en base a las cuales esta puede ser descrita.
          Ejemplo:
        En la primera actividad el carácter es la nota de cada alumno. En la segunda el carácter es pelo de los alumnos y en la tercera la altura.
          Modalidad.-
        Las modalidades son las distintas variantes de un carácter, que deben ser exhaustivas y excluyentes, es decir, cada individuo de una población debe expresar una y sólo una modalidad.
        Las modalidades se dividen en:
        · Caracteres cualitativos si las modalidades no pueden ser medidas.
        · Caracteres cuantitativos si las modalidades pueden ser expresadas métricamente. En esta situación el carácter puede ser expresado por una variable que recibe el nombre de variable estadística.
          Ejemplo:
        En la primera actividad las modalidades del caracter son los números naturales del 0 al 10, que son las posibles notas que un alumno puede obtener, es por tanto una variable estadística.
        En la segunda actividad las modalidades son los distintos colores del pelo, es por tanto un carácter cualitativo.
          Clasificación de variables.-
        Variable discreta: si toma un número finito o infinito numerable de valores.
        Variable continua: si toma un número infinito no numerable de valores.
        Variable unidimensional: si se estudia sólo un carácter cuantitativo en cada individuo.
        Variable multidimensional: si se estudian varios caracteres cuantitativos a la vez.
          Ejemplo:
        En la primera actividad tenemos una variable estadística discreta unidimensional.
        En la tercera actividad tenemos una variable estadística discreta unidimensional.
          Frecuencia absoluta de una modalidad.-
        Es el número de individuos de una muestra que han presentado esa modalidad. Se nota ni la frecuencia absoluta de la modalidad i.
          Ejemplo:
        En la primera actividad la frecuencia absoluta de la modalidad 5 es 5, y la frecuencia absoluta de la modalidad 4 es 3.
          Frecuencia relativa de una modalidad.-
        Es la proporción de individuos que han presentado esa modalidad. Se nota fi la frecuencia relativa de la modalidad i, y se calcula dividiendo la frecuencia absoluta por el tamaño de la población.
          Ejemplo:
        En la segunda actividad la frecuencia relativa de la modalidad pelo rubio es 6 : 33 = 0,18 y la frecuencia relativa de la modalidad pelo moreno es 12 : 33 = 0,36.
          Frecuencia absoluta acumulada de una modalidad.-
        Este tipo de frecuencias solo se pueden definir en caracteres cuantitativos, o en caracteres cualitativos que puedan ordenarse de mayor a menor. Se define la frecuencia absoluta acumulada de una modalidad como el número de individuos que han presentado esta modalidad o una modalidad menor. Se nota Ni la frecuencia absoluta de la modalidad y se verifica que:
      Ni = n1 + n2 + ... + ni
          Ejemplo:
        En la primera actividad la frecuencia absoluta acumulada de la nota 5 es 25.
        Frecuencia relativa acumulada de una modalidad.-
        Se puede definir en los mismos casos que la frecuencia absoluta acumulada, y se define como el cociente entre esta y el tamaño de la muestra. Se nota Fi:





        DISTRIBUCIÓN DE FRECUENCIAS
        Llamamos distribución de frecuencias al conjunto de valores que puede presentar una variable junto con sus frecuencias, estas frecuencias pueden ser cualquiera de las anteriores.
        Según la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser:
        • NO AGRUPADAS: se presentan cuando el número de valores que puede presentar la variable no es muy elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y no presenta excesivos valores.
        • AGRUPADAS EN INTERVALOS: se presenta cuando la variable es continua o cuando es discreta pero con elevado número de valores. en esta situación se agurpan dichos valores en intervalos o clases. Los intervalos se notan: ei-1-ei es es intervalo i-ésimo.

        • Se llama amplitud del intervalo a la distancia que existe entre los extremos, y se nota ai:
        ai = ei -ei-1
          Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el representante del intervalo. Se nota xi:
        xi = (ei + ei-1)/2
          Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la variable en dicho intervalo, se nota di:
        di = ni /ai
          Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero que se toma cerrado por los dos lados.
          En este tipo de distribuciones se pierde parte de la información al agruparlas en intervalos, ya no se puede hablar de valores concretas sino de intervalos. Cuanto mayor sea la amplitud de los intervalos menos intervalos habrá, y por tanto menos precisión tendremos. En cambio, cuanto menor sea la amplitud de los intervalos menos intervalos habrá, y mayor será la precisión, sin embargo la distribución será mas grande y más dificil de manejar.
          Ejemplo:
        Las dos primeras actividades dan lugar a distribuciones de frecuencia no agrupadas, ya que son variables discretas y presentan pocos valores, 11 en la primera actividad y 4 la segunda.
        la tercera actividad da lugar a una distribución de frecuencia agrupada en intervalos ya que aunque es una variable discreta, presenta muchos valores, entre el 1,58 que es el valor más pequeño que presenta, y el 1,85 que es el más grande, hay 27 valores. La elección de los intervalos depende de nosotros, teniendo en cuenta que siempre es preferible que los intervalos sean todos de la misma amplitud.



        TABLAS ESTADÍSTICAS
        Ya hemos introducido la terminología adecuada, ahora vamos a utilizarla para ordenar y agrupar la información. Lo primero que vamos a hacer es construir tablas estadísticas, en las que va a aparecer toda la información de forma ordenada.
        Llamamos tabla estadística a la disposición de forma ordenada y agrupada de los valores y frecuencias de una distribución. Distinguiremos entre tablas estadísticas de distribuciones no agrupadas y tablas de distribuciones agrupadas.
          TABLAS DE DISTRIBUCIONES NO AGRUPADAS.
        En las tablas de distribuciones no agrupadas aparecen las siguientes columnas: la primera contiene los valores de la distribución, ordenados de menor a mayor si son caracteres cuantitativos; la segunda contiene las frecuencias absolutas, la tercera las frecuencias relativas. Cuando la frecuencias acumuladas se pueden definir se añaden otras dos columnas, una para las frecuencias absolutas acumuladas y otra para las relativas acumuladas.
          Ejemplo:
        TABLA ESTADÍSTICA DE LA ACTIVIDAD 1ª, TOMANDO COMO POBLACIÓN TODA LA CLASE:

         
        xi
        ni
        Ni
        fi
        Fi
         0 2 2 0,04 0,04
        1 3 5 0,06 0,10
        2 6 11 0,12 0,22
        3 6 17 0,12 0,34
        4 3 20 0,06 0,40
        5 5 25 0,10 0,50
        6 5 30 0,10 0,60
        7 8 38 0,16 0,76
        8 6 44 0,12 0,88
        9 4 48 0,08 0,96
        10 2 50 0,04 1
         Una vez construida la tabla es muy fácil responder a las tres primeras preguntas:
        ¿Cuántos alumnos han sacado un tres? La respuesta es n3 que vale 6.
        ¿Cuántos alumnos han suspendido? La respuesta es N4 que vale 20.
        ¿Cuántos alumnos han aprobado? La respuesta es 50-N4 que vale 50-20 = 30.
        Para responder a la última pregunta: ¿Han aprobado más alumnos o alumnas? se podrian construir dos tablas una tomando como población los alumnos y otra tomando como población las alumnas y comparar las frecuencias acumuladas de la modalidad 5.
        .
        TABLA ESTADÍSTICA DE LA 2ª ACTIVIDAD TOMANDO COMO POBLACIÓN TODA LA CLASE

         
         
        xi
        ni fi
        Rubio 6 0,18
        Pelirojo 1 0,04
        Moreno 12 0,36
        Castaño 14 0,32
        33
        Con esta tabla es fácil responder a las dos primeras preguntas: El color de pelo que tiene menos gente es el pelirojo que sólo hay 1 y el que tiene más gente es el castaño que lo tienen 14 alumnos.
        Para responder a las otras preguntas vamos a construir la tabla correspondiente a considerar sólo los alumnos y la tabla correspondiente a considerar sólo las alumnas.
         
        TABLA DE ALUMNOS
        TABLA DE ALUMNAS
         
        xi
        ni
        fi
        Rubio 2
        0,13
        Pelirojo
        1
        0,07
        Moreno
        6
        0,4
        Castaño
        6
        0,4
         
         
        xi
        ni
        fi
        Rubia
        4
        0,23
        Peliroja
        0
        0
        Morena
        6
        0,33
        Castaña
        8
        0,44
         
        Ahora es muy fácil viendo estas dos tabla responder a las dos últimas preguntas de esta actividad:
        Hay más niñas morenas, 6, que rubias, 4. Y hay más niñas rubias, 4, que niños, 2.
            TABLAS DE DISTRIBUCIÓN AGRUPADAS EN INTERVALOS.
        En las tablas estadísticas de distribuciones de frecuencia agrupadas por intervalos aparecen las siguientes columnas: la primera con los intervalos, la segunda con las amplitudes de los intervalos, la tercera con las marcas de clase, la cuarta con las frecuencias absolutas de cada intervalo, la cuarta con las densidades de frecuencia y la quinta con las frecuencias relativas; además suelen aparecer tambien dos columnas más con las frecuencias acumuladas. Si se toman los intervalos con la misma amplitud no se ponen las columnas de amplitud ni de densidades, sólo se señala cual es la amplitud de todos los intervalos.
          Ejemplo:
          TABLA ESTADÍSTICA DE LA 3ª ACTIVIDAD
        En esta tabla vamos a considerar los intervalos de la misma amplitud, por lo que no vamos a representar la columna de la amplitudes ni la de las densidades. Los intervalos que vamos a considerar van a tener de amplitud 5 cm.

        Aquí se pone de manifiesto la perdida de precisión, ya no podemos hablar de cual es la altura más frecuente sino de cual es el intervalo de alturas en el que hay más alumnos. De esta forma, la respuesta a la primera pregunta de la actividad -¿Cuál es la altura más frecuente?- es que el intervalo 1.70-1.75 es el que contiene más alumnos.





        REPRESENTACIONES GRÁFICAS
        El objetivo de las representaciones gráficas es realizar una síntesis visual de la informacion aportada por una distribución de frecuencias. Según la naturaleza del carácter estudiado tendremos diversos tipos de representación gráfica:
          • Caracteres cualitativos.
          • Caracteres cuantitativos con distribuciones no agrupadas.
          • Caracteres cuantitativos con distribuciones agrupadas.
        REPRESETACIONES GRÁFICAS DE CARÁCTERES CUALITATIVOS.
        El principio que va a regir las representaciones gráficas de caracteres cualitativos será la proporcionalidad de las áreas de las figuras asignadas a cada modalidad respecto de su frecuencia absoluta.
          Diagrama de sectores.
        Consiste en dividir un circulo en tantos sectores como modalidades presente el carácter. El área de cada sector deberá ser proporcional a la frecuencia de la modalidad a la que representa. Esto se consigue haciendo que el ángulo de cada sector sea proporcional a cada frecuencia.
          Ejemplo:
        DIAGRAMA DE SECTORES DE LA ACTIVIDAD 2ª.
          Diagrama de barras.
        Consiste en representar cada modalidad mediante un rectangulo cuya base será siempre la misma y cuya área debera ser proporcional a su frecuencia absoluta. Esto se consigue poniendo la altura proporcional a la frecuencia absoluta, ya que la base es igual para todos.
          Ejemplo:
        DIAGRAMA DE BARRAS DE LA ACTIVIDAD 2ª
        REPRESENTACIONES GRÁFICAS DE CARACTERES CUANTITATIVOS NO AGRUPADOS.
        El principio de las representaciones gráficas de caracteres cuantitativos será la proporcionalidad de las áreas o de las longitudes de las figuras representadas respecto de las frecuencias absolutas o relativas de la modalidad a que represente.
          Diagrama de barras.
        Consiste en representar los valores de una variable en función de sus frecuencias absolutas o relativas, por tanto dentro de un eje de coordenadas colocaremos los valores de la variable en el eje de abcisas y la frecuencia absoluta o relativa en el eje de abcisas. La representación consiste en levantar alturas para cada valor de la variable iguales a su frecuencia.
          Ejemplo:
        DIAGRAMA DE BARRAS DE LA 1ª ACTIVIDAD
          Poligono de frecuencias.
        Se obtiene a partir del diagrama de barras uniendo mediante una linea poligonal las diversas alturas de las barras obtenidas.
          Ejemplo:
        POLIGONO DE FRECUENCIAS DE LA 1ª ACTIVIDAD

         
          Curva de distribución.
        Se llama función de distribución a la función que asocia a cada valor real la proporción de individuos de la población que presenta valores menores o iguales al valor considerado. Se representa F(x).
        La representación gráfica de F(x) es la curva de distribución. En el eje de abcisas se representan los valores de la variable y en ordenadas las frecuencias.
          Ejemplo:
        CURVA DE DISTRIBUCIÓN DE LA 1ª ACTIVIDAD
        REPRESENTACIONES GRÁFICAS DE DISTRIBUCIONES AGRUPADAS.
        Histograma de frecuencias.
        Esta representación consiste en una serie de rectangulos yuxtapuestos en el que las áreas de cada uno de ellos son proporcionales a la frecuencia absoluta o relativa de las modalidades a que representa. Las bases de los rectángulos serán las amplitudes de los intervalos, pero la altura dependiendo de si todas las amplitudes son iguales o no serán las frecuencias o las densidades de frecuencias.
          Ejemplo:
        HISTOGRAMA DE FRECUENCIAS DE LA 3ª ACTIVIDAD
        En este caso estamos ante una distrubución de frecuencias agrupada en la que como ya hicimos en la construcción de la tabla estadística vamos a considerar intervalos de la misma amplitud, por lo que vamos a utilizar como altura de los rectángulos la frecuencias de cada intervalo.
          Poligono de frecuencias.
        Se obtiene a partir del histograma de frecuencias uniendo mediante una poligonal la alturas de cada una de las marcas de clase de los intervalos considerados.
          Ejemplo:
        POLIGONO DE FRECUENCIAS DE LA 3ª ACTIVIDAD
          Curva de distribución.
        Se llama curva de distrución a la representación gráfica de la función de distribución que representa la proporción de individuos que han presentado valores menores o iguales que el valor considerado.
          Ejemplo:
        CURVA DE DISTRIBUCIÓN DE LA 3ª ACTIVIDAD





        MEDIDAS DE POSICIÓN
        Las medidas de posición solo podemos definirlas cuando estamos trabajando con variables estadísticas, es decir, cuando estamos estudiando caracteres cuantitativos.
        Las medidas de posición tienen como objetivo centrar la distribución, es decir, dar un valor númerico que pueda representar a toda la distribución.
        Las medidas de posición que vamos a estudiar son:
        • Media aritmética.
        • Mediana.
        • Moda.
        MEDIA ARITMÉTICA
        Se define la media aritmética de una distribución de frecuencias como la suma del producto de los valores de la variable por sus frecuencias absolutas divido por el tamaño de la población. Se nota :
        Si la distribución es no agrupada los xi representan a los valores de la variable, si la distribución es agrupada en intervalos los xi representan las marcas de clase.
          Ejemplo:
        En la primera actividad la media aritmética es 5,2  que podemos considerarla como nota representativa de toda la clase.
        En la segunda actividad la media aritmética es 1,71 que podemos considerarla como la altura representativa de toda la clase.
        MEDIANA
        Se llama mediana de una variable estadística a aquel valor de la variable tal que el número de observaciones menores que él es igual que el número de observaciones mayores.Se nota Me y se puede considerar como el punto de abcisas cuya ordenada en la curva vale ½.
        El cálculo de la mediana se hará teniendo en cuenta si la distribución de frecuencias es agrupada o no agrupada.
        Distribuciones no agrupadas.
        Se observa la frecuencia absoluta acumulada y pueden pasar dos casos:
        a) Si $ i en {1,…,k} / Ni > N/2 >Ni-1 =>  xi=Me
        b) Si $ i en {1,…,k} / Ni = N/2 => xi =Me
        Distribuciones agrupadas en intervalos.
        Observando las frecuencias acumuladas diremos cual es el intervalo central, que recibe el nombre de intervalo mediano. Para obtener el valor exacto de la mediana se distinguen dos casos:
        a) Si(ei-1,ei)es el intervalo mediano con Ni > N/2 >Ni-1, se realiza una interpolación lineal en la curva de distribución asociada a dicho intervalo:

        b) Si (ei-1,ei) es el intervalo mediano y Ni = N/2 >Ni-1 entonces Me=ei.
          Ejemplo:
        En la actividad 1ª la mediana es 5 pues estamos en una distribución no agrupada y la frecuencia relativa acumulada de 5 vale 0,5.
        En la actividad 3ª la mediana es 1,705 que se obtiene haciendo la interpolación lineal en el intervalo 1,70-1,75, pues la frecuencia relativa acumulada de este intervalo es 0.7 y la del intervalo anterior vale 0,433.
        MODA
        La moda es la única medida que se puede definir para caracteres cualitativos. Se define la moda de una distribución como aquel valor que se ha presentado más veces, es decir, es aquel que su frecuencia absoluta es máxima.
        Si la distribución es agrupada en intervalos se habla de intervalo modal.
        Una moda en una distribución no tiene por qué ser unica, puede haber más de una en una misma distribución, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales.
        Ejemplo:
        En la 1ª actividad la moda es 7 que se ha presentado 8 veces.
        En la 2ª actividad la moda es Castaño que se ha presentado 14 veces.
        En la 3ª actividad el intervalo modal es el 1,70-1,75 que se presenta 8 veces.



        MEDIDAS DE DISPERSIÓN
        Las medidas de dispersión nos van a informar sobre el grado de esparcimiento de la distribución, es decir, nos van a decir si los valores que aparecen estan más o menos concentrados. Por tanto, nos van informar también sobre el grado de representatividad de la medidad de posición, pues cuanto más concentrados esten los valores que toma la variable mejor representará un solo valor a toda la distribución.
        Las medidas de dispersión que vamos a estudiar son:
        • Varianza.
        • Desviación típica.
        • Coeficiente de variación.
        VARIANZA
        La varianza es una medida de dispersión que mide el grado de esparcimiento de una distribución alrededor de la media aritmética. Cuanto más grande sea la varianza más esparcidos estarán los valores de la variable. La varianza se suele notar   y se calcula:
        Al igual que en la media aritmética los xi representan a los valores de la variable si es una distribución no agrupada y a las marcas de clase si es una distribución agrupada en intervalos.
        La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmetica ponderada por las frecuencias. Por tanto, cuanto menor sea la varianza más agrupada estará la distribución en torno a su media aritmética.
        La varianza viene expresada en las misma unidades que la variable pero al cuadrado.
          Ejemplo:
        En la 1ª actividad la varianza vale 7,64.
        En la 2ª actividad la varianza vale 0,005197 m* o lo que es lo mismo 51,917 cm*.
        DESVIACIÓN TÍPICA
        La desviación típica se define para obtener una medida de dispersión que venga expresadda en las misma unidades que la variable. Se define como la raiz cuadrada de la varianza.
          Ejemplo:
        En la 1ª actividad la desviación típica vale 2,76.
        En la 2ª actividad la desviación típica vale 0,072 m, o lo que es lo mismo 7,2 cm.
        COEFICIENTE DE VARIACIÓN
        Tanto la varianza como la desviación típica son medidas de dispersión absoluta, es decir, nos hablan de la dispersión de la variable que estamos estudiando, pero no nos permiten comparar la dispersión de dos distribuciones distintas.
        El coeficiente de variación  es una medida de dispersión relativa que nos va permitir comparar dos distribuciones distintas, se define como el cociente entre la desviación típica y la media aritmética.
        El coeficiente de variación es un coeficiente adimensional y solo se puede definir cuando la media aritmética es distinta de cero.
        Para comparar la dispersión de dos distribuciones basta con comparar sus coeficientes de variación, aquella que su coeficiente de variación sea menor es la que esta más concentrada en torno a su media aritmética.
          Ejemplo:
        El coeficiente de variación de la distribución de la 1ª actividad vale 0,53 y en la 2ª actividad vale 0,42 por lo que la distribución de la 3ª actividad está más agrupada que la de la 1ª.



        Volver al índice
        Siguiente: Actividades de consolidación