|
Definiciones:
Las
medidas de tendencia central son valores que se ubican al centro de un
conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4 de
estos valores también conocidos como estadigrafos, la media aritmética, la mediana,
la moda y al rango medio.
La
media aritmética es la medida de posición utilizada con más frecuencia. Si se
tienen n valores de observaciones, la media aritmética es la suma de todos y
caca uno de los valores dividida entre el total de valores: Lo que indica que
puede ser afectada por los valores extremos, por lo que puede dar una imagen
distorcionada de la información de los datos.
La
Mediana, es el valor que ocupa la posición central en un conjunto de datos,
que deben estar ordenados, de esta manera la mitad de las observaciones es
menor que la mediana y la otra mitad es mayor que la mediana, resulta muy
apropiada cuando se poseen observaciones extremas.
La Moda
es el valor de un conjunto de datos que aparece con mayor frecuencia. No
depende de valores extremos, pero es más variables que la media y la mediana.
Rango
Medio es la media de las observaciones menor y mayor. como intervienen
solamente estas observaciones, si hay valores extremos, se distorsiona como
medida de posición, pero
ofrece
un valor adecuado, rápido y sencillo para resumir al conjunto de datos.
No Agrupados
Analicemos para ello las edades que
utilizamos cuando se vió la organización y presentación de datos discretos:
Estos fueron loa datos mostrados
originalmente, no se han ordenado ni agrupado, determinemos ahora los valores
de la Media, la Mediana y la moda, para ello recurramos a las fórmulas de
estas medidas que resumimos en la siguiente tabla:
Aplicando, se obtienen los
siguientes valores:
Para la media:
_ 12 + 15 + 14 + 15 + 16 +
18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 + 15 + 17 + 16
+ 18 + 17 + 19 + 17 + 23 + 16 + 17 + 18 + 19
X = -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 500
X = ------------ = 16.6667
30
Para la mediana debera ordenarse el grupo de
datos, como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor
mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación
directa, y correspondería al valor 17, que se presenta hasta 7 veces en la
muestra.
El rango medio se determina por la
suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos
veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también
observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los
valores que se han calculado, que circundan el valor de 17, no se notan
cambios en los resultados comparados con los datos originales, sin embargo
las formulas si se ven modificadas.
Agrupados
Recurramos ahora al agrupamiento de
los datos discretos del ejercicio que hemos estado utilizando:
En donde podemos observar la suma
de las frecuencias y de los años multiplicados por la clase que agrupa a los
datos coinciden con los datos utilizados cuando no se agruparon en la sección
anterior, utilizando ahora las formulas de la siguiente tabla:
Aplicando, se obtienen los
siguientes valores:
Para la media:
_ 12 * 1 + 14
* 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 *
1 12 + 28 +
90 + 80 + 119 + 72 + 76 + 23
X = --------------------------------------------------------------------------------------------
= ---------------------------------------------------------------
30 30
_ 500
X = ------------ = 16.6667
30
Para la Mediana, utilizaremos la frecuencia
acumulada:
Como n = 30, utilizaremos la posición p = (30/2)
= 15, el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación
directa, y correspondería al valor 17, que se presenta hasta 7 veces en la
muestra.
El rango medio se determina por la
suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos
veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también
observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los
valores que se han calculado, que circundan el valor de 17, no se notan
cambios en los resultados comparados con los datos originales, sin embargo
las formulas si se ven modificadas.
Datos Continuos
No agrupados
Las medidas de tendencia central
para datos continuos no agrupados no tienen mayor significación, ya que el
comportamiento es similar al de datos discretos no agrupados, por ello
utilizaremos las mismas formúlas, pero ahora con los datos continuos del
ejercicio de la sección correspondiente:
Aplicando, se obtienen los
siguientes valores:
Para la media, aplicando la formula
de la media para datos no agrupados (vista en la sección de datos discretos):
_ 1.25 + 1.2 +
1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23 +
1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 +
1.28 + 1.21 + 1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X =
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30
Para la Mediana, como n = 36, es par,
utilizaremos la posición p = (36/2) = 18
Por lo que la mediana se encontrará entre los
valores que se ubiquen (de manera ordenada) entre las posiciones 18 y 19
(observa que antes de esa posición hay 17 y después también hay 17 valores),
se encuentran 1.25 y 1.25, por lo que la mediana sería 1.25.
La moda estaría determinada por observación
directa, y corresponderían a los valores 1.24, 1.25 y 1.27 que se repiten en
la muestra 5 veces, por lo que la característica según la moda es una muestra
trimodal (normalmente se le conoce como multimodal).
El rango medio se determina por la
sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos
veremos que solo para el cálculo de la mediana se tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también
observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los
valores que se han calculado, que circundan el valor de 1.25.
Agrupados
Retomando los cálculos realizados
en la sección correspondiente a organización y presentación de datos
continuos agrupados.
En ella se pueden observar los
límites superiores e inferiores de cada clase, lo que indica (de no conocer
los datos originales) que por ejemplo esos 6 valores de la clase pueden
ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171,
1.20, 1.202, 1.18, 1.1901.
Es decir pueden tomar cualquier
valor dentro del rango lo que dificulta tomar estos parametros como elementos
para el cálculo de las medidas de tendencia central, por ello se realizó el
cálculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de
cada clase, que servirá para el cálculo de la media como lo establecemos en
la siguiente tabla de cálculo para las medidas de tendencia central:
Aplicandolas para calcular la media
y complementando la tabla anterior:
Con fundamento en la tabla podemos
entonces obtener:
45.122
Media = ---------------- = 1.253388889
36
Para el cálculo de la mediana, se
utiliza la formula del 5to. Decil (puede ser el 50tavo percentil), para ello
determinamos la posición de este estadígrafo, p = (36/10)*5 = 3.6 * 5 = 18.
Con este valor recurrimos a la
columna de la frecuencia acumulada y observarmos que el primer elemento mayor
al valor calculado se ubica en la clase III, aplicando la fórmula obtenemos:
((36/10)*5
– 16) (18
– 16)
Mediana = 1.251 + (----------------------------)
* 0.028 = 1.251 + (---------------) * 0.028
10 10
2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 +
(0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10
La moda se encontraría en las
clases II y III, son las que mayores frecuencias manifiestan, por lo tanto
podemos definir que existen una característica de multimodalida en la
muestra, calculemos la primera moda (dejamos como actividad complementaria el
cálculo de la segunda moda).
(
10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 =
1.213 + (--------) * 0.028 = 1.213 + 0.028
(2*
10 – 6 –
10) 4
Mo = 1.241
El rango medio se determina por la
sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos
veremos que solo para el cálculo de la mediana se tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también
observar que este ordenamiento no afecta de manera directa ninguno de los
cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los
valores que se han calculado, que circundan el valor de 1.25.
Construyamos una tabla comparativa
de resultados de cálculo de estas medidas;
Puede en esta tabla observarse una
diferencia marcada en los valores obtenidos por agrupamiento y no
agrupamiento para la media, la mediana y la moda, la última, por observación
en el caso de no agrupamiento nos presenta 3 modas, mientras que en el
agrupamiento, se obtienen 2 modas, la realidad es que el agrupar datos
continuos se tiene una perdida de valores por la aproximación que se tiene al
calcular por ejemplo la marca de clase como valor representativo medio de la misma.
Después de estos ejercicios que
realizamos para la determinación de las medidas de tendencia central, para
datos discretos y continuos tanto agrupados como no agrupados, realicemos los
ejercicios de evaluación de esta sección, para ello baja el documento
correspondiente en la sección de archivador (Ejercicios de Medidas de
Tendencia Central.pdf) , resuelve los ejercicios (de preferencia en excel o
en un software estadístico (spss, minitab, etc.) posteriormente envíalo a:
leonardo.hernandez@gmai.com o sube tus respuestas en los archivos adjuntos de
esta página.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
jueves, 26 de febrero de 2015
medidas de tendencia central 2
Suscribirse a:
Comentarios de la entrada (Atom)



No hay comentarios.:
Publicar un comentario