martes, 10 de noviembre de 2015

Desviación estándar y varianza

Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.
La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"
La desviación estándar o desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación estándar se representa por σ.
de relación típicadesviación

Desviación estándar para datos agrupados

desviación típicadesviación
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
desviación típicadesviación típica

Desviación estándar para datos agrupados

desviación típicadesviación típicaVarianza
la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:
1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)

Ejemplo

Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviación estándar.

Respuesta:

Media =  
600 + 470 + 170 + 430 + 300
  =  
1970
  = 394
5
5
así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
Ahora calculamos la diferencia de cada altura con la media:
Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:
Varianza: σ2 =  
2062 + 762 + (-224)2 + 362 + (-94)2
  =  
108,520
  = 21,704
5
5
Así que la varianza es 21,704.
Y la desviación estándar es la raíz de la varianza, así que:
Desviación estándar: σ = √21,704 = 147
y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia menos de la desviación estándar (147mm) de la media:
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño.
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se enteren!
La medidas de centralización nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:

Moda

La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas ycuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuenciano hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Cálculo de la moda para datos agrupados

1º Todos los intervalos tienen la misma amplitud.

fórmula de la moda
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
moda

Ejemplo

Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
 fi
[60, 63)5
[63, 66)18
[66, 69)42
[69, 72)27
[72, 75)8
 100
moda
moda

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.
alturas
La clase modal es la que tiene mayor altura.
moda

La fórmula de la moda aproximada cuando existen distintas amplitudes es:
moda

Ejemplo

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
 fihi
[0, 5)153
[5, 7)2010
[7, 9)126
[9, 10)33
 50 
moda
moda

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana

Ordenamos los datos de menor a mayor.
Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
Si la serie tiene un número par de puntuaciones la mediana es la media entre las dospuntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre cociente.
mediana
Li es el límite inferior de la clase donde se encuentra la mediana.
cociente es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
 fiFi
[60, 63)55
[63, 66)1823
[66, 69)4265
[69, 72)2792
[72, 75)8100
 100 
100 / 2 = 50
Clase modal: [66, 69)
mediana

Media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre elnúmero total de datos.
símbolo de la media aritmética es el símbolo de la media aritmética.
fórmula de la media
media

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
media aritmética

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
media
media

Ejercicio de media aritmética

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
 xifixi · fi
[10, 20)15115
[20, 30)258200
[30,40)3510350
[40, 50)459405
[50, 60558440
[60,70)654260
[70, 80)752150
  421 820
media

Propiedades de la media aritmética

La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la mediade la misma igual a cero.
expresión
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
La media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.
mínimo
Si a todos los valores de la variable se les suma un mismo número, la media aritméticaqueda aumentada en dicho número.
Si todos los valores de la variable se multiplican por un mismo número la media aritméticaqueda multiplicada por dicho número.

Observaciones sobre la media aritmética

La media se puede hallar sólo para variables cuantitativas.
La media es independiente de las amplitudes de los intervalos.
La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.
La media no se puede calcular si hay un intervalo con una amplitud indeterminada.
 xifi
[60, 63)61.55
[63, 66)64.518
[66, 69)67.542
[69, 72)70.527
[72, ∞ ) 8
  100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último intervalo.