math-concepts

Entender la probabilidad de forma intuitiva (por qué "1 en un millón" te engaña)

4 de mayo de 202613 min de lectura
Entender la probabilidad de forma intuitiva (por qué "1 en un millón" te engaña)

El pronóstico dice 30 por ciento de probabilidad de lluvia. Un análisis médico para una enfermedad rara vuelve positivo. El bote de la lotería está en 200 millones de dólares y tu compañero de trabajo está comprando un fajo de boletos. En cada una de estas situaciones tu instinto tiene una opinión, y tu instinto casi siempre se equivoca. La probabilidad es el lugar donde la intuición matemática falla con más frecuencia, incluso a personas brillantes, incluso a quienes enseñan la materia. Los números no son difíciles. Los instintos que los rodean sí engañan.

Este artículo es un mapa de lo que es realmente una probabilidad, por qué se rompen las intuiciones habituales, y cómo repararlas. Las matemáticas son sencillas. El cambio de perspectiva es la parte más difícil, y resulta útil en casi todos los ámbitos que una persona pueda tocar: meteorología, medicina, deportes, finanzas, juegos de azar, aprendizaje automático, e incluso decisiones cotidianas sobre riesgos como volar versus conducir.

La Única Idea: Contar

Quitando todo lo demás, la probabilidad es contar. Para hallar la probabilidad de un evento, cuentas los resultados en los que ese evento ocurre y divides entre el número total de resultados posibles. Esa es la definición completa. Cada fórmula del tema es una forma cuidadosa de contar.

Lanza un dado de seis caras. La probabilidad de sacar un 4 es un resultado (el 4) dividido entre seis resultados totales (del 1 al 6), lo que da 1/6. La probabilidad de sacar un número par es tres resultados (2, 4, 6) divididos entre seis totales, es decir 3/6, o 1/2. La probabilidad de sacar un número mayor que 7 es cero resultados divididos entre seis, que es 0, porque ese resultado no existe.

Si esto te recuerda a las fracciones, es porque lo es. Como mostramos en el artículo sobre fracciones, una fracción es una división esperando ocurrir. La probabilidad es exactamente esa misma idea aplicada a resultados: los que coinciden sobre el total. El tema entero son fracciones hasta el final.

La dificultad está en que "contar resultados" se complica a medida que las situaciones se vuelven más complejas. El resto del tema, permutaciones, combinaciones, probabilidad condicional, teorema de Bayes, no es más que una contabilidad cuidadosa para contar bien cuando la situación no es tan sencilla como un dado.

Eventos Independientes: Cuándo se Multiplican las Probabilidades

Supón que lanzas una moneda justa dos veces. ¿Cuál es la probabilidad de sacar cara dos veces seguidas?

Mucha gente responde 1/2 más 1/2, que es 1, y eso evidentemente no puede ser correcto. Otros dicen 1/2, que parece más seguro pero también es incorrecto. La respuesta correcta es 1/2 por 1/2, que es 1/4, y el razonamiento vale la pena pensarlo un momento, porque es el paso que rompe la intuición de la mayoría de los principiantes.

Cuando dos eventos son independientes (el resultado de uno no tiene ningún efecto sobre el otro), la probabilidad de que ambos ocurran es el producto de sus probabilidades individuales. ¿Por qué multiplicar? Lista todos los resultados posibles de dos lanzamientos de moneda: CC, CS, SC, SS. Hay cuatro en total, y solo uno es CC, así que la respuesta es 1/4. La multiplicación es simplemente un atajo para ese listado.

La misma idea explica por qué las rachas largas son tan raras. La probabilidad de sacar cara diez veces seguidas es (1/2) elevado a la décima potencia, que es aproximadamente 1 en 1.024. No es imposible, pero tampoco es común. Y la probabilidad de adivinar un PIN de seis dígitos al azar es (1/10) elevado a la sexta potencia, que es uno en un millón. Ese es el tipo de "uno en un millón" que es real. Ahora vamos a ver varios que no lo son.

Cuando los Eventos No Son Independientes

La independencia es el supuesto que hace fallar más problemas de probabilidad que cualquier otro. Si sacas dos cartas de una baraja sin devolver la primera, la probabilidad de la segunda carta no es la misma que la de la primera, porque la baraja ha cambiado. Hay 52 cartas y 4 ases, así que la probabilidad de sacar un as primero es 4/52. Después de sacar un as, la baraja tiene 51 cartas y 3 ases, por lo que la probabilidad de un segundo as es 3/51. La probabilidad de dos ases seguidos es, por tanto, 4/52 por 3/51, que es aproximadamente un 0,45 por ciento.

Esto es la probabilidad condicional: la probabilidad de un evento dado que otro ya ha ocurrido. Se escribe P(B dado A), y es lo que la mayoría del razonamiento en el mundo real realmente necesita. "¿Cuál es la probabilidad de que llueva mañana?" es un número. "¿Cuál es la probabilidad de que llueva mañana dado que el radar muestra una celda de tormenta sobre la ciudad?" es un número diferente, mucho mayor. La nueva información reorganiza el recuento de resultados relevantes.

La mayoría de las "paradojas" en probabilidad son problemas de probabilidad condicional con el condicionamiento escondido en silencio. Cuando desenredas ese condicionamiento, la paradoja suele desaparecer.

La Paradoja del Cumpleaños

Aquí tienes una pregunta que atrapa a casi todo el mundo. En una sala con 23 personas, ¿cuál es la probabilidad de que al menos dos de ellas compartan fecha de cumpleaños?

La respuesta intuitiva es pequeña, porque hay 365 días y solo 23 personas. La respuesta real es algo más del 50 por ciento. Con 50 personas en la sala sube al 97 por ciento. Con 70 personas supera el 99,9 por ciento. Esta es la paradoja del cumpleaños, y no es un fallo del universo. Es un fallo en la forma en que la intuición cuenta.

La trampa está en que no preguntas "¿cuál es la probabilidad de que alguien comparta mi cumpleaños?". Preguntas "¿cuál es la probabilidad de que dos personas cualesquiera compartan cumpleaños?". Con 23 personas hay 23 sobre 2, que son 253 pares distintos de personas, y cada par tiene una pequeña probabilidad de coincidir. Son muchas oportunidades, y las probabilidades pequeñas se acumulan más rápido de lo que el instinto espera.

La lección es general. Cuando el número de oportunidades para que ocurra un evento crece cuadráticamente (cada par, cada interacción), los eventos raros se vuelven comunes rápidamente. Una probabilidad de 1 en 365 por par se convierte en una probabilidad superior al 50 por ciento en total una vez que hay 253 pares.

La Tasa Base y el Truco de Uno en un Millón

Un análisis médico tiene una "precisión del 99 por ciento" para una enfermedad que afecta a 1 de cada 10.000 personas. El resultado es positivo. ¿Cuál es la probabilidad de que realmente tengas la enfermedad?

Mucha gente, incluidos médicos, responde alrededor del 99 por ciento. La respuesta correcta está más cerca del 1 por ciento.

Aquí está el porqué. Imagina 10.000 personas aleatorias. Aproximadamente 1 de ellas tiene la enfermedad, y el test probablemente la detectará. Las otras 9.999 no la tienen, pero un test con un 99 por ciento de precisión clasifica incorrectamente al 1 por ciento de las personas sanas como positivos, lo que son unos 100 falsos positivos. Así que de cada 101 resultados positivos, 100 son falsas alarmas y solo 1 es real. La probabilidad de que realmente tengas la enfermedad, dado un resultado positivo, es aproximadamente 1 en 101, es decir, alrededor del 1 por ciento.

Esta es la falacia de la tasa base. Cuando el evento subyacente es raro (baja tasa base), incluso un test muy preciso produce sobre todo falsos positivos. La mayoría de las personas omite la tasa base por completo y solo piensa en la precisión del test, lo que las lleva a un número incorrecto por dos órdenes de magnitud.

La lección se generaliza mucho más allá de la medicina. "1 en un millón" es un número que siempre debería provocar una pregunta de seguimiento: 1 en un millón ¿de qué? ¿1 en un millón por día, por año, por intento, por persona? Un evento de probabilidad 1 en un millón diariamente ocurre aproximadamente 365 veces al año si hay suficientes días, y alrededor de 8.000 millones de veces al año si hay suficientes personas. Una vez que tienes en cuenta la población y la ventana temporal, "1 en un millón" suele dejar de parecer raro. La noticia que abre este artículo funciona de la misma manera: la mayoría de los "milagros" que se reportan en los medios son eventos de 1 en un millón que tuvieron varios miles de millones de oportunidades de ocurrir.

La Falacia del Jugador

Una ruleta ha salido roja ocho veces seguidas. ¿No le toca ya al negro?

No. La ruleta no tiene memoria. La probabilidad del negro en la siguiente tirada es la misma que en la primera. Esta es la falacia del jugador: la creencia de que los eventos independientes pasados cambian las probabilidades de los futuros. No lo hacen.

La versión opuesta del mismo error es la falacia de la mano caliente: la creencia de que un jugador que acaba de encadenar varios aciertos seguidos tiene más probabilidad de acertar el siguiente. Para lanzamientos de moneda y ruleta esto es claramente incorrecto, porque el dispositivo no tiene memoria. Para el rendimiento humano el panorama es genuinamente más complejo (la habilidad real existe, el impulso real a veces existe), pero la lección de fondo se mantiene: la mayoría de las rachas son reconocimiento de patrones por parte de un animal que evolucionó para encontrar patrones tanto si están ahí como si no.

Dónde Aparece la Probabilidad

Una vez que tienes el marco del conteo, la probabilidad aparece en todas partes.

Pronósticos meteorológicos: un 30 por ciento de probabilidad de lluvia significa que, en un conjunto amplio de condiciones atmosféricas similares, llovió en aproximadamente el 30 por ciento de ellas. No es una garantía, y no es un lanzamiento de moneda.

Medicina: cada test, cribado y puntuación de riesgo implica el truco de la tasa base anterior. Un test "positivo" significa cosas muy distintas para enfermedades comunes y raras, y "99 por ciento de precisión" sin una tasa base es casi irrelevante.

Seguros y finanzas: cada prima, rendimiento esperado y modelo de riesgo es una media ponderada sobre los resultados posibles. Las matemáticas son simplemente probabilidad multiplicada por ganancia, sumada sobre todos los escenarios posibles.

Pruebas estandarizadas: el SAT, el ACT, el GRE, AP Statistics y el GCSE incluyen todos preguntas de probabilidad, y muchas de ellas son problemas de probabilidad condicional disfrazados. Como señalamos en nuestra guía de preparación para el SAT, el truco no está en la aritmética, sino en reconocer la estructura.

Aprendizaje automático: cada clasificador produce probabilidades, y cada métrica (precisión, exhaustividad, curvas ROC) es una aplicación cuidadosa de la probabilidad condicional y las tasas base. La falacia de la tasa base golpea de nuevo aquí: un modelo con un 99 por ciento de precisión en un evento raro puede seguir siendo inútil en producción.

Estimar Probabilidades Rápidamente

La mayoría de los problemas de probabilidad en la vida real no necesitan una respuesta exacta. Necesitan una estimación rápida y razonada. Estos son los pasos que te llevan la mayor parte del camino.

Traduce primero a fracción, luego a porcentaje o decimal. "1 en 100" es 1/100 es 1 por ciento es 0,01. Como vimos en trucos de cálculo mental, la fluidez con estas conversiones es una de las habilidades con mayor impacto que puedes desarrollar, porque casi todos los problemas de probabilidad terminan con una traducción entre notaciones.

Busca siempre la tasa base, especialmente cuando alguien te da un número de precisión para un evento raro. Si la tasa base es pequeña, el número de precisión es engañoso.

Comprueba la independencia con cuidado. Dos eventos parecen independientes cuando en realidad uno influye en el otro (resultados de tests del mismo paciente, acciones del mismo sector, estudiantes de la misma clase). Cuando los eventos comparten una causa oculta, multiplicar las probabilidades da un resultado demasiado pequeño o demasiado grande.

Pon a prueba "1 en un millón". Pregunta: ¿por qué, entre cuántas personas, durante cuánto tiempo? La mayoría de los eventos "raros" no son raros una vez que cuentas las oportunidades.

Cómo la Práctica Construye el Reflejo

La probabilidad es el tema donde el reconocimiento de patrones importa más, porque el mismo problema llega con veinte disfraces distintos. El estudiante que ha visto y repasado las estructuras (independiente versus dependiente, con sustitución versus sin ella, condicional versus conjunta) empieza a detectar la estructura en segundos, y la aritmética surge de ese reconocimiento.

La progresión por niveles de Math Zen se adapta perfectamente a cómo quiere aprenderse realmente el tema. Los primeros niveles trabajan el conteo de resultados en experimentos simples (dados, cartas, monedas). Los niveles intermedios practican la regla de la multiplicación y la regla de la adición para uniones, con práctica mixta para que el cerebro aprenda a identificar la situación en lugar de aplicar una fórmula a ciegas. Los niveles avanzados trabajan la probabilidad condicional, el valor esperado y los problemas clásicos (paradoja del cumpleaños, Monty Hall, problemas de tasa base). Como la práctica es breve y espaciada, tienes múltiples oportunidades de reconocer la estructura, lo que es lo que finalmente convierte las reglas en reflejos.

La Conclusión

La probabilidad es una sola idea: cuenta los resultados que coinciden, divide entre todos los resultados que existen, y sé honesto sobre si los eventos que estás contando son realmente independientes. Las "paradojas" son simplemente situaciones donde el instinto cuenta algo diferente de lo que cuentan las matemáticas. Multiplica cuando los eventos son independientes. Suma cuando quieres la probabilidad de cualquiera de los dos (restando el solapamiento para no contar dos veces). Condicionea cuando llega información nueva. Busca siempre la tasa base, especialmente cuando alguien te da un "1 en un millón".

Una vez que empieces a preguntar "1 en un millón ¿de qué, por qué, entre cuántos?", el mundo cotidiano deja de parecer aleatorio de la misma manera. La lotería se convierte en una pequeña pérdida esperada con premios gordos raros. El análisis médico se convierte en una pregunta sobre tasas base. La racha caliente se convierte en una coincidencia que el cerebro está vistiendo de causalidad. Los números no cambian, pero la forma en que los lees sí, y ese cambio tiene un rendimiento para siempre.