ANALISIS
DE LAS MEDIDIAS DE UNA DISTRIBUCION:
§ VARIABLE ALEATORIA
En probabilidad y estadística, una variable
aleatoria o variable estocástica es una variable estadística cuyos valores se
obtienen de mediciones en algún tipo de experimento aleatorio. Formalmente, una
variable aleatoria es una función, que asigna eventos (p.e., los posibles
resultados de tirar un dado dos veces: (1, 1), (1, 2), etc.) a números reales
(p.e., su suma).
Los valores posibles de una variable
aleatoria pueden representar los posibles resultados de un experimento aún no
realizado, o los posibles valores de una cantidad cuyo valor actualmente
existente es incierto (p.e., como resultado de medición incompleta o
imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una
cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribución de probabilidad se usa para
describir la probabilidad de que se den los diferentes valores.
Las variables aleatorias suelen
tomar valores reales, pero se pueden considerar valores aleatorios como valores
lógicos, funciones... El término elemento aleatorio se utiliza para
englobar todo ese tipo de conceptos relacionados.
EJEMPLO
Supongamos que se lanzan dos monedas
al aire. El espacio muestral, esto es, el conjunto de resultados elementales
posibles asociado al experimento, es
,
Donde (c representa "sale
cara" y x, "sale cruz").
Podemos asignar entonces a cada
suceso elemental del experimento el número de caras obtenidas. De este modo se
definiría la variable aleatoria X como la función
Dada por
El recorrido o rango de esta
función, RX, es el conjunto
§ FUNCIÓN DE PROBABILIDAD
En teoría de la
probabilidad, una función de probabilidad (también
denominada función de masa de probabilidad) es una función que asocia a
cada punto de su espacio muestral X la
probabilidad de que ésta lo asuma.
La gráfica de una función
de probabilidad de masa, note que todos los valores no son negativos, y la suma
de ellos es igual a 1.
La funcion de masa de probabilidad
de un Dado. Todos los números
tienen la misma probabilidad de aparecer cuando este es tirado.
En concreto, si el espacio
muestral, E de la variable aleatoria X consta de los
puntos x1, x2,..., xk, la función de probabilidad P asociada
a X es
Donde pi es la
probabilidad del suceso X = xi.
Por definición de probabilidad,
Hay que advertir que el concepto de
función de probabilidad sólo tiene sentido para variables aleatorias que toman
un conjunto discreto de valores. Para variables aleatorias continuas el
concepto análogo es el de función de densidad.
§ ESPERANZA MATEMÁTICA
En estadística la esperanza
matemática (también llamada esperanza, valor esperado, media
poblacional o media) de una variable aleatoria , es el número que formaliza la
idea de valor medio de un fenómeno aleatorio.
Cuando la variable aleatoria es
discreta, la esperanza es igual a la suma de la probabilidad de cada
posible suceso aleatorio multiplicado por el
valor de dicho suceso. Por lo tanto, representa la cantidad media que se
"espera" como resultado de un experimento aleatorio cuando la
probabilidad de cada suceso se mantiene constante y el experimento se repite un
elevado número de veces. Cabe decir que el valor que toma la esperanza
matemática en algunos casos puede no ser "esperado" en el sentido más
general de la palabra - el valor de la esperanza puede ser improbable o incluso
imposible.
EJEMPLO
El valor esperado cuando tiramos un
dado equilibrado de 6 caras es 3,5. Podemos hacer el cálculo
§ VARIANZA
En teoría de probabilidad,
la varianza (que suele representarse como ) de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación
de dicha variable respecto a su media.
Está medida en unidades distintas de
las de la variable. Por ejemplo, si la variable mide una distancia en metros,
la varianza se expresa en metros al cuadrado. La desviación estándar, es la raíz cuadrada
de la varianza, es una medida de dispersión alternativa expresada en las mismas
unidades de los datos del variable objeto de estudio. La varianza tiene como
valor mínimo 0.
Hay que tener en cuenta que la
varianza puede verse muy influida por los valores atípicos y no se aconseja
su uso cuando las distribuciones de las variables aleatorias tienen colas
pesadas. En tales casos se recomienda el uso de otras medidas de dispersión
más robustas.
El término varianza fue
acuñado por Ronald Fisher en un artículo
de 1918 titulado The
Correlation Between Relatives on the Supposition of Mendelian Inheritance.
EJEMPLO
Tiene media μ = λ−1. Por lo tanto,
su varianza es:
Es decir, σ2 = μ2.
§ DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación
típica (denotada con el símbolo σ) es una medida de centralización o dispersión para variables
de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como la raíz cuadrada de
la varianza. Junto con este
valor, la desviación típica es una medida (cuadrática) que informa de la media
de distancias que tienen los datos respecto de su media aritmética, expresada en las
mismas unidades que la variable.
Para conocer con detalle un conjunto
de datos, no basta con conocer las medidas de tendencia central, sino que
necesitamos conocer también la desviación que presentan los datos en su
distribución respecto de la media aritmética de dicha distribución, con objeto
de tener una visión de los mismos más acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones.
EJEMPLO
Aquí se muestra cómo calcular la
desviación estándar de un conjunto de datos. Los datos
representan la edad de los miembros de un grupo de niños: { 4, 1, 11, 13,
2, 7 }
.
En este caso, N = 6 porque
hay seis datos:
i = número de datos para sacar
desviación estándar
Sustituyendo N por
6
Este
es el promedio.
2. Calcular la desviación estándar
Sustituyendo N
- 1 por 5; ( 6 - 1 )
Sustituyendo por 6,33
Éste
es el valor de la desviación estándar.
buana
ResponderEliminar