Probabilidades y estadísticas

La probabilidad y la estadística son dos ramas de las matemáticas que se ocupan de la recogida, el análisis, la interpretación y la presentación de datos en el contexto de los acontecimientos aleatorios. A menudo se estudian juntas debido a su interrelación.

Términos básicos de la probabilidad

Para hablar de la probabilidad, es importante estar familiarizado con la terminología utilizada. A continuación se presentan algunos de los términos más utilizados en probabilidad.

  • Experimento: procedimiento que da lugar a resultados bien definidos. Un experimento aleatorio es aquel en el que no es posible determinar qué resultado exacto se producirá.
  • Resultado: cualquier resultado posible contenido en un espacio muestral, S.
  • Espacio muestral: todos los resultados posibles de un experimento forman un espacio muestral. El espacio muestral para el lanzamiento de una moneda justa es S = {cabeza, cruz}.
  • Evento: un evento es cualquier subconjunto de un espacio muestral. Dado un suceso, A, cuando se produce un resultado que pertenece al subconjunto A, se ha producido un suceso. Por ejemplo, dado que el suceso A es el suceso de que un dado justo de seis caras caiga en un número par, los resultados 2, 4 y 6 satisfacen el suceso A. Si se lanza cualquiera de esos valores, el suceso A ha ocurrido. Si salen 1, 3 o 5, el suceso A no se produce.
  • Ensayo – Cada lanzamiento de una moneda, tirada de un dado o iteración de un experimento se denomina ensayo. En el experimento de lanzar una moneda para determinar el número de caras, cada lanzamiento de la moneda es un ensayo en el experimento.

Probabilidad

El resultado de un suceso aleatorio, como el lanzamiento de una moneda, no puede determinarse con certeza antes de que se produzca. Sin embargo, si se conocen los posibles resultados (en este caso, cara o cruz), la teoría de la probabilidad nos permite predecir la posibilidad de que se produzca un determinado resultado. En su uso más común, la probabilidad de que algo ocurra es la proporción o fracción de veces que es probable que ocurra un resultado concreto.

La probabilidad se representa con un valor numérico entre 0 y 1 que describe la probabilidad de que un evento ocurra. Una probabilidad de 0 indica que es imposible que un suceso ocurra, mientras que una probabilidad de 1 significa que es seguro que ocurra. La probabilidad también suele expresarse mediante porcentajes. Por ejemplo, una probabilidad de 0,5 de cara o cruz indica que hay un 50% de posibilidades de que se produzca cualquiera de los dos resultados.

Hay varias formas de determinar la probabilidad de un suceso. Una de ellas es especular con la probabilidad del suceso. Por ejemplo, suponiendo que una moneda es justa, podemos especular que hay una probabilidad de 0,5 (½ o 50%) de que salga cara o cruz en un lanzamiento determinado de la moneda. Sin embargo, si lanzamos una moneda muchas veces y observamos y recopilamos una gran cantidad de datos para descubrir que la moneda sale cara el 75% de las veces, podemos determinar que la moneda no es justa y está sesgada hacia la cruz, suponiendo que nuestra recopilación de datos y la probabilidad observada estén bien fundamentadas.

A continuación se muestra un ejemplo de cálculo de la probabilidad de un suceso simple.

Ejemplo

¿Cuál es la probabilidad de sacar un 5 con un dado justo de 6 caras?

Para un dado de 6 caras perfectamente equilibrado, la posibilidad de que aparezca cada cara es la misma. Por lo tanto, la probabilidad de sacar un 5 puede calcularse como el número de formas en que puede producirse el resultado deseado (1) del número total de resultados posibles (6) o:

Hay aproximadamente un 16,67% de posibilidades de sacar un 5.

Tipos de sucesos

El ejemplo anterior es la forma más sencilla de cálculo de probabilidades. Hay muchos otros tipos de sucesos en probabilidad y es importante entender cada tipo, ya que el cálculo de sus respectivas probabilidades es diferente.

Suceso simple

Un suceso simple es un suceso que sólo tiene un resultado. Por ejemplo, al lanzar una moneda, el resultado de que salga cara es un ejemplo de suceso simple; que salga cruz es un ejemplo de otro suceso simple. La probabilidad de un suceso simple se calcula como:

Suceso compuesto

Un suceso compuesto es un suceso que incluye dos o más sucesos simples. Lanzar una moneda dos veces y que salga cara dos veces es un ejemplo de suceso compuesto. La probabilidad de que la moneda salga cara en el primer lanzamiento es del 50%, y la probabilidad de que salga cara en el segundo lanzamiento también es del 50%. La probabilidad de que una moneda salga cara dos veces seguidas es una probabilidad compuesta que se calcula como el producto de las probabilidades de los sucesos independientes, es decir

0.5 × 0.5 = 0.25

Consulta la página de sucesos compuestos para obtener más información sobre cómo calcular las probabilidades compuestas de los distintos tipos de sucesos.

Sucesos independientes

Los sucesos independientes son aquellos en los que el resultado de un suceso no se ve afectado por el resultado de otro. Lanzar una moneda es un ejemplo de suceso independiente porque en cada lanzamiento de una moneda justa, la probabilidad de obtener cara o cruz es igual. Independientemente del resultado de un lanzamiento anterior de una moneda, un lanzamiento posterior sigue teniendo un 50% de probabilidades de que salga cruz y un 50% de probabilidades de que salga cara.

Sucesos dependientes

Los sucesos dependientes son aquellos en los que el resultado de un suceso se ve afectado por el resultado de otro suceso. Por ejemplo, dado que una bolsa contiene 3 canicas rojas y 2 canicas rojas, si se saca una de las canicas de la bolsa, hay un 60% de posibilidades de que la canica sea azul y un 40% de que sea roja. Si se saca una canica azul de la bolsa y no se sustituye, la probabilidad de seleccionar una canica azul en un ensayo posterior ya no es del 60%. Como ahora hay 2 canicas azules y 2 rojas en la bolsa, la probabilidad de seleccionar cualquiera de ellas es del 50%. Dado que la probabilidad en el siguiente ensayo se ve afectada por un resultado en el primero, éste es un ejemplo de suceso dependiente.

Sucesos mutuamente excluyentes

Los sucesos mutuamente excluyentes son sucesos que no pueden ocurrir al mismo tiempo. El resultado de cara o cruz al lanzar una moneda son ejemplos de sucesos mutuamente excluyentes. En un solo lanzamiento de la moneda, ésta sólo puede salir cara o cruz. Si sale cara, significa que la moneda no ha salido cruz (y viceversa), ya que ambas cosas no pueden ocurrir al mismo tiempo.

Sucesos complementarios

El complemento de un suceso A, denominado AC, está formado por todos los resultados que no están contenidos en el suceso A. Por ejemplo, un dado justo de seis caras tiene los posibles resultados 1, 2, 3, 4, 5 y 6. Dado que el suceso A es la probabilidad de sacar un número par, o A = {2, 4, 6}, su complemento es AC = {1, 3, 5}. Por tanto, las probabilidades de A y AC deben sumar 1. En otras palabras

P(A) + P(AC) = 1

P(AC) = 1 – P(A)

Reglas básicas de la probabilidad

Las probabilidades se calculan de forma diferente en función de varios factores, entre ellos los tipos de sucesos. A continuación se presentan tres reglas de uso común.

Regla de la adición

Si A y B no son sucesos mutuamente excluyentes, la probabilidad de que ocurra A o B es

P(A ∪ B) = P(A) + P(B) – P(A ∩ B)

donde P(A ∩ B) es la probabilidad de que ocurran A y B.

Si A y B son eventos mutuamente excluyentes, entonces

P(A ∪ B) = P(A) + P(B),

ya que P(A ∩ B) = 0.

Consulta la página de teoría de conjuntos para obtener más información sobre la notación utilizada.

Regla de la multiplicación

La regla de la multiplicación se utiliza para hallar la probabilidad de que dos sucesos ocurran al mismo tiempo. Si A y B son sucesos dependientes, la probabilidad de que A y B ocurran al mismo tiempo es

P(A ∩ B) = P(A)P(B|A)

donde P(B|A) es la probabilidad condicional de que ocurra el suceso B si ya ha ocurrido el suceso A.

Ejemplo:

Se extraen dos cartas de una baraja estándar de 52 cartas. Sea A el caso de que se elija un rey. B es el suceso de que se elija otro rey, dado que la primera carta elegida no se sustituye en la baraja. Calcule la probabilidad de que ocurran tanto A como B.

Como hay 4 reyes en una baraja estándar de 52 cartas

P(A) = 4/52

Como hay que quitar un rey en la primera extracción para sacar 2 reyes seguidos, el número de reyes y el total de cartas de la baraja se reducen en 1. Por lo tanto

P(B|A) = 3/51

La probabilidad de elegir 2 reyes seguidos es el producto de estas probabilidades:

P(A ∩ B) = P(A)P(B|A) = 4/52 × 3/51 ≈ 0,005

Por lo tanto, la probabilidad de seleccionar 2 reyes seguidos es aproximadamente del 0,5%.

Regla de Bayes

La regla de Bayes (o teorema de Bayes) es un tipo de probabilidad condicional que puede derivarse de la regla de la multiplicación. La probabilidad de que ocurra el suceso A dado que ya ha ocurrido el suceso B puede determinarse como:

La regla de Bayes es útil porque no requiere conocer la probabilidad conjunta de A y B.

Estadística

La estadística es una disciplina que consiste en recoger, organizar, mostrar, analizar, interpretar y presentar datos. Se utiliza ampliamente en la investigación científica, en la consideración de problemas sociales y con fines industriales, entre otras muchas aplicaciones.

En un nivel básico, implica la recopilación adecuada de datos a través de un muestreo cuando los datos de la población no se conocen o no pueden determinarse, el diseño y la realización de estudios experimentales y de observación, y la formulación de conclusiones o el rediseño de los estudios a partir de los datos. Dos ramas distintas de la estadística son la estadística descriptiva y la estadística inferencial.

Estadística descriptiva

La estadística descriptiva es la rama de la estadística que se ocupa de resumir los datos, ya sea en forma gráfica, tabular o de otro tipo. Una estadística descriptiva es una estadística de resumen utilizada para describir los datos. Ejemplos de estadísticas descriptivas bien conocidas son la media, la mediana y la moda; se clasifican como medidas de tendencia central y son uno de los tipos clave de estadísticas descriptivas que proporcionan información sobre un valor central o típico en una distribución de probabilidad. Las medidas de variabilidad son otra clasificación de la estadística descriptiva; describen la dispersión de los datos (lo estirada o apretada que está la distribución) e incluyen estadísticas como la desviación estándar, la varianza, etc.

La siguiente figura muestra dos tipos de figuras utilizadas para representar estadísticas descriptivas.

Histograma
Gráfico de cajas y bigotes

En particular, el histograma y la curva ajustada a él indican una distribución normal, que es una distribución de probabilidad comúnmente encontrada en toda la estadística. Muchos fenómenos naturales presentan una distribución normal, lo que da paso a la estadística inferencial, que nos permite hacer inferencias sobre los datos basándonos en sus distribuciones de probabilidad, así como en otros factores.

Estadística inferencial

En el mundo real, a menudo no es posible, o es muy poco práctico, recoger grandes cantidades de datos de poblaciones de interés. Lo ideal sería poder adquirir todos los datos que necesitamos de una población y tomar decisiones informadas basadas en las estadísticas descriptivas que proporcionan. Siendo realistas, dado que esto rara vez es factible, en su lugar hacemos inferencias sobre las poblaciones en su conjunto basándonos en muestras de dichas poblaciones y en el uso de métodos estadísticos; éste es el objetivo de la estadística inferencial.

Por ejemplo, podemos querer saber la puntuación media en el examen de Física AP de todos los estudiantes de secundaria de los Estados Unidos. Debido a la gran escala, sería difícil y costoso obtener los resultados de cada uno de los estudiantes de Estados Unidos. En este caso, se puede utilizar la estadística inferencial para estimar la puntuación media mediante la recogida de muestras de la población de estudiantes de secundaria y, a continuación, utilizar los datos de la muestra para hacer inferencias o predicciones sobre la puntuación media de la población en su conjunto.

Al estudiar los fenómenos aleatorios, podemos querer evaluar si las diferencias observadas pueden atribuirse a algún factor determinado, o si las diferencias observadas pueden atribuirse totalmente al azar. Esta es otra área en la que se puede utilizar la estadística inferencial mediante el proceso de comprobación de hipótesis estadísticas. Hay muchos tipos diferentes de pruebas de hipótesis estadísticas que pueden utilizarse en función de las condiciones del experimento. En general, el proceso implica la afirmación de que no hay diferencias, lo que se denomina hipótesis nula, y la comparación de lo observado con lo que cabría esperar según esta hipótesis nula. Mediante el uso de métodos estadísticos, podemos sacar conclusiones sobre la importancia de los datos observados.