Distribución de probabilidad

Una distribución de probabilidad es una función que describe las probabilidades de ocurrencia de los diversos resultados posibles de una variable aleatoria . Como ejemplo simple, considere el experimento de lanzar una moneda al aire tres veces. Los posibles resultados de cada lanzamiento individual son cara o cruz. Sea la variable aleatoria X el número de cruces que resultan de tres lanzamientos de una moneda justa; el espacio de muestra de este experimento es:

{HHH, HHT, HTH, HTT, THH, THT, TTH, TTT}

Por lo tanto, hay 1 forma de que ocurra 0 colas, 3 formas de que ocurra 1 colas, 3 formas de que ocurran 2 colas y 1 forma de que ocurran 3 colas; la distribución de probabilidad se muestra en la siguiente tabla:

Número de colasProbabilidad
01/8
13/8
23/8
31/8

Lo anterior es un ejemplo de una distribución de probabilidad discreta. Tenga en cuenta que la suma de probabilidades debe ser 1.

Todas las distribuciones de probabilidad se pueden clasificar como distribuciones de probabilidad discretas o distribuciones de probabilidad continuas.

Distribución de probabilidad discreta

Una distribución de probabilidad es discreta o continua dependiendo de si la variable aleatoria es discreta o continua. Una variable discreta solo puede tomar valores distintos, como el lanzamiento de una moneda que cae en cara o cruz, o el número de estudiantes en una clase. La moneda solo puede caer en cara o cruz, mientras que el número de estudiantes en una clase es un número específico, como 20. No puede haber 20.5 estudiantes, 30.7 estudiantes, etc.

Una distribución de probabilidad discreta se puede describir mediante una función de masa de probabilidad (pmf), que proporciona la probabilidad de ocurrencia de cada valor de una variable aleatoria discreta. Un pmf tiene las siguientes propiedades:

  • La probabilidad, P, de x ∈ X es: P (X=x)=f (x)
  • f (x) ≥ 0 para todo x
  • La suma de las probabilidades de todos los valores posibles debe ser igual a 1:

Se puede usar una distribución uniforme discreta para representar una variable aleatoria que tiene un número finito de valores que tienen la misma probabilidad de ocurrencia. Lanzar un dado de 6 caras es un ejemplo, ya que cada una de las 6 caras del dado tiene la misma probabilidad de ocurrir en un lanzamiento dado.

Sea X una variable aleatoria discreta con n valores en el intervalo [a, b]. X tiene una distribución uniforme discreta si su pmf está definido por

para x=1, 2, 3, … n. Tiene la siguiente forma:


Distribución binomial

Se utiliza una distribución binomial para modelar un experimento en el que solo hay dos resultados posibles. Lanzar una moneda justa de dos caras es un ejemplo, ya que los únicos resultados posibles son cara o cruz. A continuación se muestra un ejemplo de una distribución binomial para el experimento de lanzar 2 monedas justas:


El pmf para una distribución binomial es:

p es la probabilidad de éxito de una prueba individual
q=1 – p es la probabilidad de falla
n es el número de pruebas
x es el número de éxitos de n ensayos

Ejemplo

Dado que solo el 20% de todos los adultos pueden aprobar una prueba cognitiva específica, ¿cuál es la probabilidad de que de 5 adultos seleccionados al azar, 3 de ellos pasen la prueba?

Dado que solo hay dos resultados posibles, aprobado o reprobado, podemos usar el pmf para una distribución binomial para determinar la probabilidad, donde p=0.2, q=0.8, n=5 y x=3:

 

Por lo tanto, existe un 5% de probabilidad de que 3 de los 5 adultos elegidos al azar pasen la prueba cognitiva.

Distribución de Poisson

Se puede utilizar una distribución de Poisson para modelar la probabilidad de que ocurra un evento independiente una cierta cantidad de veces durante un período específico de tiempo (o distancia, área , volumen, etc.). Por ejemplo, la cantidad de veces al mes que un automóvil pasa una luz roja en particular puede presentar una distribución de Poisson.

El pmf para una distribución de Poisson es

Distribución de probabilidad continua

Una variable continua es aquella que puede tomar cualquier valor dentro de algún intervalo, y una distribución de probabilidad continua es la distribución de probabilidad de una variable aleatoria continua. Los ejemplos de variables continuas incluyen la altura y el peso. Hay límites superior e inferior para la altura y el peso humanos, pero dentro de esos límites, hay un número infinito de alturas y pesos posibles. Por ejemplo, es poco probable que dos personas que miden 5 pies y 8 pulgadas de alto tengan exactamente la misma altura. En cambio, su altura probablemente varía en algún valor decimal que no se puede medir con precisión.

La probabilidad de que una variable aleatoria continua adopte cualquier resultado individual es 0, por lo que, a diferencia de las distribuciones de probabilidad discretas, las distribuciones de probabilidad continuas no se pueden representar mediante una tabla. En cambio, las distribuciones de probabilidad continuas se representan típicamente mediante una función de densidad de probabilidad, que se puede usar para determinar la probabilidad de que la variable aleatoria se encuentre dentro de un cierto rango de valores. La siguiente figura es un ejemplo de una distribución de probabilidad continua.


La probabilidad de que un resultado, X, se encuentre entre el intervalo ayb está representada por el área sombreada debajo de la curva, que se puede encontrar calculando la integral de la función de densidad de probabilidad en el intervalo dado. En otras palabras,

Tenga en cuenta que si a fueran -∞ y b fueran + ∞,

Esto se debe a que la probabilidad de todo el PDF debe ser igual a 1, ya que existe un 100% de probabilidad de que X se encuentre en este intervalo si es un número real.

Hay muchos tipos diferentes de distribuciones de probabilidad continua, incluida una distribución normal, una distribución uniforme continua y una distribución de chi cuadrado.

Distribución normal

La distribución normal, también conocida como distribución gaussiana, o más informalmente como curva de campana, es una de las distribuciones de probabilidad más comunes. Su nombre informal se basa en el hecho de que tiene forma de campana, aunque no es el único tipo de distribución que tiene forma de campana. La siguiente figura muestra una distribución normal donde μ es la media y σ es la desviación estándar.


Una distribución normal es simétrica con respecto a su media, y la mayoría de los valores de una distribución normal se agrupan alrededor de la media, con el 99,7% de los valores dentro de 3 desviaciones estándar de la media. Cuanto más lejos esté un valor de la media, es menos probable que ocurra. Más específicamente, para una variable aleatoria continua que tiene una distribución normal, el 68% de las observaciones caerán dentro de una desviación estándar de la media, el 95% caerán dentro de dos desviaciones estándar y el 99.7% caerán dentro de tres desviaciones estándar.

El pdf de una variable aleatoria continua que tiene una distribución normal es

donde μ es la media y σ es la desviación estándar. Como algunas otras distribuciones de probabilidad ampliamente utilizadas, existen tablas matemáticas para los valores de la función de distribución acumulativa de la distribución normal. La tabla normal estándar, también conocida como tabla Z, se puede usar para determinar la probabilidad de que un valor se encuentre dentro de un intervalo específico en una distribución normal.

Una de las razones por las que la distribución normal es tan importante y de uso común es porque muchas cantidades físicas, como la altura y el peso, tienen distribuciones casi normales. Debido a esto, muchas pruebas estadísticas están diseñadas para su uso con poblaciones distribuidas normalmente. Por lo tanto, dado que una cantidad en estudio exhibe una distribución normal, los investigadores pueden usar muchos métodos estadísticos confiables para hacer inferencias sobre la población basándose en muestras recolectadas.

Distribución uniforme continua

Una distribución uniforme continua es un tipo de distribución de probabilidad simétrica que tiene la siguiente función de densidad de probabilidad:

A continuación se muestra una representación gráfica del pdf de una distribución uniforme continua.


Una distribución aleatoria continua también se conoce como distribución rectangular debido al rectángulo formado, como se muestra en el área sombreada en la figura. A medida que aumenta el ancho del pdf, la densidad de cualquier valor dado disminuye. Además, dado que todas las funciones de densidad de probabilidad se integran a 1 en sus respectivos intervalos, la altura de la función de densidad de probabilidad disminuye a medida que aumenta su ancho. Las distribuciones continuas uniformes se pueden usar para describir experimentos en los que la variable aleatoria continua es simétrica y se encuentra dentro de un intervalo específico.

Distribución de chi-cuadrado

La distribución chi-cuadrado es una de las distribuciones más utilizadas en estadística, particularmente para la prueba de hipótesis y la construcción de intervalos de confianza. El pdf para una distribución chi-cuadrado es


donde k son los grados de libertad y es la función gamma:

No siempre es necesario integrar el pdf de una distribución chi-cuadrado. Al igual que otras distribuciones de probabilidad, existen tablas que se pueden utilizar para determinar estadísticas importantes, como el valor p, que puede indicar si una estadística de prueba es estadísticamente significativa o no.

IFAST