math-concepts

Wahrscheinlichkeit intuitiv verstehen (warum "einer von einer Million" Sie belügt)

4. Mai 202612 Min. Lesezeit

Wahrscheinlichkeit intuitiv verstehen (warum "einer von einer Million" Sie belügt)

Die Wettervorhersage sagt 30 Prozent Regenwahrscheinlichkeit. Ein medizinischer Test auf eine seltene Krankheit fällt positiv aus. Der Lotto-Jackpot liegt bei 200 Millionen, und Ihr Kollege kauft einen Stapel Lose. In jeder dieser Situationen hat Ihr Bauch eine Meinung, und Ihr Bauch liegt meistens falsch. Wahrscheinlichkeit ist der Bereich, in dem die mathematische Intuition die meisten Menschen am häufigsten im Stich lässt, sogar kluge Menschen, sogar Menschen, die das Fach unterrichten. Die Zahlen sind nicht schwer. Die Intuitionen rund um sie sind irreführend.

Dieser Artikel ist das Bild davon, was eine Wahrscheinlichkeit eigentlich ist, warum vertraute Intuitionen scheitern und wie man sie repariert. Die Mathematik ist einfach. Der Denkwechsel ist der härtere Teil, und er zahlt sich in fast jedem Lebensbereich aus, mit dem ein Mensch je zu tun hat: Wetter, Medizin, Sport, Finanzen, Glücksspiel, maschinelles Lernen, sogar alltägliche Risikoentscheidungen wie fliegen oder fahren.

Die eine Idee: Zählen

Streichen Sie alles andere weg, und Wahrscheinlichkeit ist Zählen. Um die Wahrscheinlichkeit eines Ereignisses zu finden, zählen Sie die Ausgänge, bei denen das Ereignis eintritt, und teilen dann durch die Gesamtzahl der Ausgänge, mit denen Sie begonnen haben. Das ist die gesamte Definition. Jede Formel im Kapitel ist eine sorgfältige Art zu zählen.

Würfeln Sie einen fairen sechsseitigen Würfel. Die Chance, eine 4 zu bekommen, ist ein Ausgang (eine 4) geteilt durch sechs Gesamtausgänge (1 bis 6), also 1/6. Die Chance, eine gerade Zahl zu bekommen, ist drei Ausgänge (2, 4, 6) geteilt durch sechs gesamt, also 3/6 oder 1/2. Die Chance, eine Zahl größer als 7 zu bekommen, ist null Ausgänge geteilt durch sechs, also 0, weil ein solcher Ausgang nicht existiert.

Wenn das Bild nach Brüchen klingt, dann deshalb, weil es genau das ist. Wie wir im Beitrag über Brüche gezeigt haben, ist ein Bruch eine Division, die noch passieren wird. Wahrscheinlichkeit ist genau dieselbe Idee, angewendet auf Ausgänge: die passenden geteilt durch alle. Das gesamte Fach ist Brüche bis zum Schluss.

Der Haken ist, dass "Ausgänge zählen" schwerer wird, je komplizierter die Situationen werden. Der Rest des Kapitels, also Permutationen, Kombinationen, bedingte Wahrscheinlichkeit, Satz von Bayes, ist nur sorgfältige Buchführung darüber, wie man gut zählt, wenn die Situation nicht so einfach ist wie ein Würfel.

Unabhängige Ereignisse: Wann Wahrscheinlichkeiten multipliziert werden

Angenommen, Sie werfen eine faire Münze zweimal. Wie hoch ist die Wahrscheinlichkeit, zweimal hintereinander Kopf zu bekommen?

Viele Menschen tippen auf 1/2 plus 1/2, also 1, was offensichtlich nicht stimmen kann. Manche antworten 1/2, was sich sicherer anfühlt, aber auch falsch ist. Die richtige Antwort ist 1/2 mal 1/2, also 1/4, und der Grund ist es wert, einen Moment darüber nachzudenken, denn das ist der Schritt, der bei den meisten Anfängern die Intuition zerbricht.

Wenn zwei Ereignisse unabhängig sind (der Ausgang des einen hat keinen Einfluss auf den Ausgang des anderen), dann ist die Wahrscheinlichkeit, dass beide eintreten, das Produkt ihrer Einzelwahrscheinlichkeiten. Warum multiplizieren? Listen Sie jeden möglichen Ausgang von zwei Münzwürfen auf: KK, KZ, ZK, ZZ. Es gibt vier insgesamt, und nur einer davon ist KK, also lautet die Antwort 1/4. Die Multiplikation ist nur eine Abkürzung für diese Auflistung.

Dieselbe Idee erklärt, warum lange Serien so selten sind. Die Chance, zehnmal hintereinander Kopf zu werfen, ist (1/2) hoch zehn, also etwa 1 zu 1.024. Nicht unmöglich, aber nicht häufig. Und die Chance, zufällig eine sechsstellige PIN richtig zu erraten, ist (1/10) hoch sechs, also eins zu einer Million. Das ist die Art von "eins zu einer Million", die echt ist. Wir werden gleich mehrere kennenlernen, die es nicht sind.

Wenn Ereignisse nicht unabhängig sind

Unabhängigkeit ist die Annahme, an der mehr Wahrscheinlichkeitsaufgaben scheitern als an jeder anderen. Wenn Sie zwei Karten aus einem Stapel ziehen, ohne die erste zurückzulegen, ist die Wahrscheinlichkeit der zweiten Karte nicht dieselbe wie die der ersten, weil sich der Stapel verändert hat. Es gibt 52 Karten und 4 Asse, also ist die Wahrscheinlichkeit, zuerst ein Ass zu ziehen, 4/52. Nachdem Sie ein Ass gezogen haben, hat der Stapel 51 Karten und 3 Asse, also ist die Wahrscheinlichkeit für ein zweites Ass 3/51. Die Wahrscheinlichkeit für zwei Asse hintereinander ist daher 4/52 mal 3/51, also etwa 0,45 Prozent.

Das ist bedingte Wahrscheinlichkeit: die Wahrscheinlichkeit eines Ereignisses unter der Voraussetzung, dass ein anderes bereits eingetreten ist. Sie wird als P(B gegeben A) geschrieben, und das ist es, was die meisten realen Überlegungen eigentlich wollen. "Wie hoch ist die Chance, dass es morgen regnet?" ist eine Zahl. "Wie hoch ist die Chance, dass es morgen regnet, gegeben dass das Radar eine Gewitterzelle über der Stadt zeigt?" ist eine andere, viel höhere Zahl. Die neue Information ordnet die Zählung der relevanten Ausgänge neu.

Die meisten "Paradoxa" in der Wahrscheinlichkeit sind Aufgaben zur bedingten Wahrscheinlichkeit, bei denen die Bedingung still versteckt ist. Lösen Sie die Bedingung auf, und das Paradoxon verschwindet meistens.

Das Geburtstagsparadoxon

Hier ist eine Frage, die fast jeden überrascht. Wie hoch ist in einem Raum mit 23 Personen die Wahrscheinlichkeit, dass mindestens zwei von ihnen am selben Tag Geburtstag haben?

Die intuitive Antwort ist klein, weil es 365 Tage gibt und nur 23 Personen. Die tatsächliche Antwort liegt bei knapp über 50 Prozent. Bei 50 Personen im Raum klettert sie auf 97 Prozent. Bei 70 Personen liegt sie über 99,9 Prozent. Das ist das Geburtstagsparadoxon, und es ist kein Fehler im Universum. Es ist ein Fehler in der Art, wie die Intuition zählt.

Die Falle ist, dass Sie nicht fragen "wie hoch ist die Wahrscheinlichkeit, dass jemand denselben Geburtstag hat wie ich". Sie fragen "wie hoch ist die Wahrscheinlichkeit, dass irgendwelche zwei Personen denselben Geburtstag teilen". Bei 23 Personen gibt es 23 über 2, also 253 verschiedene Personenpaare, und jedes Paar hat eine kleine Chance auf eine Übereinstimmung. Das sind viele Chancen, und kleine Wahrscheinlichkeiten summieren sich schneller, als der Bauch erwartet.

Die Lehre ist allgemein. Wenn die Anzahl der Gelegenheiten für ein Ereignis quadratisch wächst (jedes Paar, jede Interaktion), werden seltene Ereignisse schnell häufig. Eine Chance von 1 zu 365 pro Paar wird zu einer Chance von mehr als 50 Prozent insgesamt, sobald es 253 Paare gibt.

Basisraten und der Trick mit der einen Million

Ein medizinischer Test ist zu "99 Prozent genau" für eine Krankheit, die 1 von 10.000 Menschen betrifft. Sie testen positiv. Wie hoch ist die Wahrscheinlichkeit, dass Sie die Krankheit tatsächlich haben?

Viele Menschen, einschließlich Ärzte, tippen auf etwa 99 Prozent. Die richtige Antwort liegt näher bei 1 Prozent.

Hier ist der Grund. Stellen Sie sich 10.000 zufällige Menschen vor. Etwa 1 von ihnen hat die Krankheit, und der Test wird ihn wahrscheinlich erfassen. Die anderen 9.999 haben sie nicht, aber ein zu 99 Prozent genauer Test stuft 1 Prozent der gesunden Menschen fälschlicherweise als positiv ein, also etwa 100 falsch-positive Ergebnisse. Von jeweils 101 positiven Ergebnissen sind also 100 Fehlalarme und nur 1 ist echt. Die Wahrscheinlichkeit, dass Sie die Krankheit tatsächlich haben, gegeben einen positiven Test, ist ungefähr 1 zu 101 oder etwa 1 Prozent.

Das ist der Basisraten-Fehlschluss. Wenn das zugrunde liegende Ereignis selten ist (niedrige Basisrate), erzeugt selbst ein sehr genauer Test überwiegend falsch-positive Ergebnisse. Die meisten Menschen überspringen die Basisrate komplett und denken nur an die Testgenauigkeit, was sie zu einer Zahl führt, die um zwei Größenordnungen falsch ist.

Die Lehre lässt sich weit über die Medizin hinaus verallgemeinern. "Eins zu einer Million" ist eine Zahl, die immer eine Rückfrage auslösen sollte: eins zu einer Million von was? Eins zu einer Million pro Tag, pro Jahr, pro Versuch, pro Person? Ein Ereignis mit einer Wahrscheinlichkeit von 1 zu einer Million pro Tag tritt etwa 365 Mal pro Jahr auf, wenn die Welt genug Tage hat, und etwa 8 Milliarden Mal pro Jahr, wenn die Welt genug Menschen hat. Sobald Sie die Bevölkerung und das Zeitfenster mit einbeziehen, fühlt sich "eins zu einer Million" meistens nicht mehr selten an. Die Schlagzeile, mit der dieser Artikel öffnet, funktioniert genauso: Die meisten "Wunder", über die in den Nachrichten berichtet wird, sind Ereignisse mit einer Wahrscheinlichkeit von 1 zu einer Million, die mehrere Milliarden Gelegenheiten hatten zu passieren.

Der Spielerfehlschluss

Ein Roulettekessel hat achtmal hintereinander Rot gezeigt. Sicher ist Schwarz jetzt überfällig?

Ist es nicht. Der Kessel hat kein Gedächtnis. Die Wahrscheinlichkeit für Schwarz beim nächsten Dreh ist dieselbe wie beim ersten. Das ist der Spielerfehlschluss, der Glaube, dass vergangene unabhängige Ereignisse die Chancen zukünftiger verändern. Tun sie nicht.

Die Spiegelversion desselben Fehlers ist der Hot-Hand-Fehlschluss: der Glaube, dass ein Spieler, der gerade mehrere Würfe hintereinander getroffen hat, mit höherer Wahrscheinlichkeit auch den nächsten trifft. Bei Münzwürfen und Roulette ist das eindeutig falsch, weil das Gerät kein Gedächtnis hat. Bei menschlicher Leistung ist das Bild tatsächlich komplizierter (echtes Können existiert, echter Schwung existiert manchmal), aber die zugrunde liegende Lehre bleibt: Die meisten Serien sind Mustererkennung durch ein Tier, das sich entwickelt hat, um Muster zu finden, ob sie da waren oder nicht.

Wo Wahrscheinlichkeit auftaucht

Sobald Sie den Zählrahmen haben, taucht Wahrscheinlichkeit überall auf.

Wettervorhersagen: Eine Regenwahrscheinlichkeit von 30 Prozent bedeutet, dass es bei einer großen Menge ähnlicher atmosphärischer Bedingungen in etwa 30 Prozent der Fälle geregnet hat. Es ist keine Garantie und es ist kein Münzwurf.

Medizin: Jeder Test, jedes Screening und jeder Risikoscore beinhaltet den Basisraten-Trick von oben. Ein "positiver" Test bedeutet bei häufigen und seltenen Erkrankungen sehr unterschiedliche Dinge, und "99 Prozent genau" ohne Basisrate ist nahezu bedeutungslos.

Versicherungen und Finanzen: Jede Prämie, jede erwartete Rendite und jedes Risikomodell ist ein gewichteter Mittelwert über mögliche Ausgänge. Die Mathematik ist einfach Wahrscheinlichkeit mal Auszahlung, summiert über alle möglichen Szenarien.

Standardisierte Tests: SAT, ACT, GRE, AP Statistics und Abitur enthalten alle Wahrscheinlichkeitsaufgaben, und viele davon sind verkleidete Aufgaben zur bedingten Wahrscheinlichkeit. Wie wir in unserem SAT-Vorbereitungsleitfaden angemerkt haben, liegt der Trick nicht in der Arithmetik, sondern darin, die Struktur zu erkennen.

Maschinelles Lernen: Jeder Klassifikator erzeugt Wahrscheinlichkeiten, und jede Metrik (Präzision, Recall, ROC-Kurven) ist eine sorgfältige Anwendung von bedingter Wahrscheinlichkeit und Basisraten. Der Basisraten-Fehlschluss schlägt auch hier zu: Ein Modell, das bei einem seltenen Ereignis zu 99 Prozent genau ist, kann in der Produktion trotzdem nutzlos sein.

Chancen schnell schätzen

Die meisten realen Wahrscheinlichkeitsfragen brauchen keine exakte Antwort. Sie brauchen eine schnelle, vertretbare Schätzung. Hier sind die Schritte, die Sie den größten Teil des Weges bringen.

Übersetzen Sie zuerst in einen Bruch, dann in einen Prozentwert oder eine Dezimalzahl. "1 zu 100" ist 1/100 ist 1 Prozent ist 0,01. Wie wir in den Kopfrechen-Tricks behandelt haben, ist Geläufigkeit mit diesen Umrechnungen eine der hebelstärksten Fähigkeiten, die Sie aufbauen können, denn fast jede Wahrscheinlichkeitsaufgabe endet mit einer Übersetzung zwischen Schreibweisen.

Suchen Sie immer nach der Basisrate, besonders wenn Ihnen jemand eine Genauigkeitszahl für ein seltenes Ereignis nennt. Wenn die Basisrate klein ist, ist die Genauigkeitszahl irreführend.

Prüfen Sie die Unabhängigkeit sorgfältig. Zwei Ereignisse sehen unabhängig aus, obwohl in Wirklichkeit eines das andere antreibt (Testergebnisse beim selben Patienten, Aktien innerhalb desselben Sektors, Schüler in derselben Klasse). Wenn Ereignisse eine versteckte Ursache teilen, ergibt das Multiplizieren der Wahrscheinlichkeiten eine Antwort, die zu klein oder zu groß ist.

Stresstesten Sie "eins zu einer Million". Fragen Sie: pro was, über wie viele Menschen, über welchen Zeitraum? Die meisten "seltenen" Ereignisse sind nicht selten, sobald man die Gelegenheiten zählt.

Wie Übung den Reflex aufbaut

Wahrscheinlichkeit ist das Thema, bei dem Mustererkennung am wichtigsten ist, denn dasselbe Problem kommt in zwanzig verschiedenen Verkleidungen daher. Der Schüler, der die Strukturen immer wieder gesehen hat (unabhängig versus abhängig, mit Zurücklegen versus ohne, bedingt versus gemeinsam), beginnt die Struktur innerhalb von Sekunden zu erkennen, und die Arithmetik fällt aus dieser Erkennung heraus.

Die Bucket-Progression von Math Zen passt sauber zu der Art, wie das Thema tatsächlich gelernt werden möchte. Die frühesten Buckets behandeln das Zählen von Ausgängen für einfache Experimente (Würfel, Karten, Münzen). Die mittleren Buckets drillen die Multiplikationsregel und die Additionsregel für Vereinigungen, mit gemischter Übung, sodass das Gehirn lernt, die Situation zu identifizieren, statt blind eine Formel anzuwenden. Die späteren Buckets arbeiten an bedingter Wahrscheinlichkeit, Erwartungswert und den klassischen Rätseln (Geburtstagsparadoxon, Ziegenproblem, Basisratenaufgaben). Weil die Übung kurz und verteilt ist, bekommen Sie wiederholte Chancen, die Struktur zu erkennen, was die Regeln am Ende zu Reflexen macht.

Das Fazit

Wahrscheinlichkeit ist eine Idee: Zählen Sie die Ausgänge, die passen, teilen Sie durch alle Ausgänge, die existieren, und bleiben Sie ehrlich, ob die Ereignisse, die Sie zählen, wirklich unabhängig sind. Die "Paradoxa" sind nur Situationen, in denen der Bauch etwas anderes zählt als die Mathematik. Multiplizieren Sie, wenn Ereignisse unabhängig sind. Addieren Sie, wenn Sie die Chance auf eines von beiden wollen (und subtrahieren Sie die Überlappung, damit Sie nicht doppelt zählen). Bedingen Sie, wenn neue Informationen ankommen. Suchen Sie immer nach der Basisrate, besonders wenn Ihnen jemand "eins zu einer Million" reicht.

Sobald Sie anfangen zu fragen "eins zu einer Million von was, pro was, über wie viele?", hört die Alltagswelt auf, sich auf dieselbe Weise zufällig anzufühlen. Die Lotterie wird zu einem kleinen erwarteten Verlust mit seltenen Jackpots. Der medizinische Test wird zu einer Frage über Basisraten. Die Glückssträhne wird zu einem Zufall, den das Gehirn in Kausalität einkleidet. Die Zahlen ändern sich nicht, aber die Art, wie Sie sie lesen, ändert sich, und diese Veränderung zahlt sich für immer aus.