確率を直感的に理解する（「100万分の1」があなたを欺く理由）

天気予報は降水確率30パーセントだと言います。まれな病気の医療検査が陽性で返ってきます。宝くじの賞金が2億ドルに達し、同僚は山ほどチケットを買い込んでいます。こうした場面のどれにおいても、あなたの直感には意見があり、そしてその直感はたいてい間違っています。確率は、数学的な直感が最も多くの人を最も頻繁に裏切る場所です。聡明な人でも、この主題を教える人でさえ例外ではありません。数字そのものは難しくありません。それを取り囲む直感のほうが、人を惑わせるのです。

この記事は、確率とは実際には何なのか、なじみのある直感がなぜ破綻するのか、そしてそれをどう修正するかを描いた一枚の絵です。算数は単純です。難しいのは考え方の転換のほうですが、その見返りは、ほぼあらゆる領域で得られます: 天気、医療、スポーツ、金融、ギャンブル、機械学習、さらには飛行機と車のどちらが安全かといった日常的なリスク判断にまで及びます。

たったひとつの考え: 数えること

すべてを取り払ってしまえば、確率とは数えることです。ある事象の確率を求めるには、その事象が起こる結果の数を数え、出発点とした全結果の数で割ります。それが定義のすべてです。この章のあらゆる公式は、上手に数えるための注意深い方法にすぎません。

公平な6面ダイスを振りましょう。4が出る確率は1つの結果（4）を6つの全結果（1から6）で割って1/6です。偶数が出る確率は3つの結果（2、4、6）を全6つで割って3/6、つまり1/2です。7より大きい数が出る確率は0つの結果を6で割って0です。そんな結果はそもそも存在しないからです。

この絵が分数のように聞こえるとしたら、それは実際そうだからです。分数の記事で示したように、分数とはまだ実行されていない割り算です。確率はそれと全く同じ考えを結果に当てはめたものです。条件に合うものを全体で割るのです。この主題は最後まで分数だらけです。

ただし、状況が複雑になるにつれて「結果を数える」ことは難しくなります。残りの章、つまり順列、組み合わせ、条件付き確率、ベイズの定理は、ダイスほど単純でない状況において上手に数えるための注意深い会計処理にすぎません。

独立な事象: 確率を掛け合わせるとき

公平なコインを2回投げるとしましょう。表が2回連続で出る確率はいくらでしょうか？

多くの人は1/2足す1/2、つまり1と推測しますが、それが正しいはずがないのは明らかです。安全策で1/2と答える人もいますが、これも間違いです。正解は1/2掛ける1/2、つまり1/4です。なぜそうなるのかは、少し立ち止まって考える価値があります。ここが多くの初学者にとって直感が崩れるポイントだからです。

2つの事象が独立であるとき（一方の結果がもう一方の結果に何の影響も与えないとき）、両方が起こる確率はそれぞれの確率の積になります。なぜ掛け算なのでしょうか？コイン2回投げの全結果を書き出してみましょう: HH、HT、TH、TT。全部で4通りあり、そのうちHHは1つだけです。だから答えは1/4。掛け算はこの書き出しのショートカットにすぎないのです。

同じ考えで、長い連勝がなぜそれほどまれなのかも説明できます。10回連続で表が出る確率は(1/2)の10乗、約1024分の1です。不可能ではありませんが、よくあることでもありません。そして6桁のPINをランダムに当てる確率は(1/10)の6乗、つまり100万分の1です。これが本物の「100万分の1」です。これからいくつか、本物ではない「100万分の1」に出会うことになります。

事象が独立でないとき

独立性は、ほかのどの仮定よりも多くの確率問題を破綻させる仮定です。デッキから1枚目を戻さずに2枚カードを引くと、デッキが変わってしまうので、2枚目の確率は1枚目と同じではありません。52枚のカードに4枚のエースがあるので、最初にエースを引く確率は4/52です。エースを引いた後、デッキは51枚でエースは3枚なので、2枚目もエースである確率は3/51です。したがって、エースを2枚連続で引く確率は4/52掛ける3/51、約0.45パーセントです。

これが条件付き確率です。ある事象がすでに起こったときに、別の事象が起こる確率のことで、P(B|A)と書きます。実世界の推論が本当に求めているのは、たいていこちらのほうです。「明日雨が降る確率は？」はひとつの数字です。「レーダーが街の上空に嵐の雲を示しているときに、明日雨が降る確率は？」は別の、ずっと高い数字です。新しい情報が、関係する結果の数え方を組み替えるのです。

確率における「パラドックス」のほとんどは、条件づけがこっそり隠された条件付き確率の問題です。条件づけをほどけば、たいていパラドックスは消えてなくなります。

誕生日のパラドックス

ほぼ誰もが引っかかる問いを紹介します。23人がいる部屋で、少なくとも2人が誕生日を共有する確率はいくらでしょうか？

直感的な答えは「小さい」です。1年は365日もあり、人は23人しかいないからです。実際の答えは50パーセントを少し超えるあたりです。50人いれば97パーセントまで上がります。70人いれば99.9パーセントを超えます。これが誕生日のパラドックスであり、宇宙のバグではありません。直感の数え方のバグなのです。

罠は、あなたが問うているのが「誰かが私の誕生日と同じである確率」ではない、という点です。あなたは「任意の2人が同じである確率」を問うているのです。23人いれば、23人から2人を選ぶ組み合わせ、つまり253通りのペアがあり、それぞれのペアに小さな一致確率があります。チャンスの数は多く、小さな確率は直感が予想するよりずっと速く積み上がります。

教訓は一般的なものです。事象の機会の数が二次的に増えるとき（あらゆるペア、あらゆる相互作用）、まれな事象はあっという間にありふれたものになります。ペアあたり1/365の確率は、253ペアもあれば全体としては五分五分を超える確率になるのです。

ベースレートと「100万分の1」のトリック

ある医療検査は、1万人に1人が罹患する病気に対して「99パーセント正確」だとされています。あなたは陽性が出ました。実際にその病気にかかっている確率はいくらでしょうか？

医師を含めて多くの人は99パーセント前後と推測します。正解は1パーセントに近い数字です。

理由はこうです。1万人のランダムな人々を想像してください。そのうち約1人が病気にかかっており、検査はおそらくそれを捉えます。残りの9999人は病気ではありませんが、99パーセント正確な検査は健常者の1パーセントを陽性と誤判定するので、約100人の偽陽性が出ます。すると、陽性結果101件のうち、100件は誤報で、本物はわずか1件です。陽性が出たという条件のもとで実際に病気である確率は、おおよそ101分の1、つまり約1パーセントなのです。

これがベースレートの誤謬です。下にある事象がまれなとき（ベースレートが低いとき）、非常に正確な検査でさえ、出てくる陽性のほとんどは偽陽性になります。多くの人はベースレートを完全にすっ飛ばし、検査の正確さだけを考えてしまうので、二桁ぶんずれた答えにたどり着いてしまうのです。

教訓は医療をはるかに超えて一般化できます。「100万分の1」という数字を見たら、いつも続けてこう問うべきです: 何の100万分の1なのか？ 1日あたり、1年あたり、1試行あたり、1人あたり？ 1日あたり100万分の1の事象は、世界に十分な日数があれば年に約365回、世界に十分な人がいれば年に約80億回起こります。人口と時間の幅を組み込むと、「100万分の1」はたいてい、もはやまれには感じられなくなります。この記事の冒頭の見出しも同じ仕組みです。ニュースで報じられる「奇跡」のほとんどは、起こるチャンスが数十億回もあった「100万分の1」の事象なのです。

ギャンブラーの誤謬

ルーレットの台で赤が8回連続して出ました。さすがに次は黒の番ではないでしょうか？

そうではありません。ルーレットには記憶がありません。次のスピンで黒が出る確率は、最初のスピンと同じです。これがギャンブラーの誤謬であり、過去の独立な事象が将来の事象の確率を変えるという思い込みです。実際には変えません。

同じ間違いの鏡像版がホットハンドの誤謬です。シュートを連続で決めた選手は、次もシュートを決める確率が高いという思い込みです。コイン投げやルーレットなら、装置に記憶がないので明らかに誤りです。人間のパフォーマンスについては、絵はもう少し複雑になります（本物のスキルは存在し、本物の勢いも時には存在します）が、根本の教訓は変わりません: 連勝のほとんどは、実在しようがしまいがパターンを見出すように進化した動物による、パターンマッチングの産物なのです。

確率はどこに登場するか

数えるという枠組みを手にすると、確率はあらゆるところに姿を現します。

天気予報: 降水確率30パーセントとは、似たような大気条件が大量に集まったとき、その約30パーセントで雨が降った、という意味です。保証ではないし、コイン投げでもありません。

医療: あらゆる検査、スクリーニング、リスクスコアに、上述のベースレートのトリックが関わっています。「陽性」検査結果は、よくある病気とまれな病気とでまったく違う意味を持ちますし、ベースレートを伴わない「99パーセント正確」はほとんど意味をなしません。

保険と金融: あらゆる保険料、期待リターン、リスクモデルは、起こりうる結果に対する加重平均です。算数はただの「確率掛ける利得」を、起こりうるシナリオすべてにわたって合計したものにすぎません。

標準テスト: SAT、ACT、GRE、AP統計、GCSEのいずれにも確率の問題が含まれており、その多くは姿を変えた条件付き確率の問題です。SAT対策ガイドで述べたように、難しいのは算数ではなく、構造を見抜くことなのです。

機械学習: あらゆる分類器は確率を出力していますし、あらゆる指標（適合率、再現率、ROC曲線）は条件付き確率とベースレートの注意深い応用です。ここでもベースレートの誤謬は襲いかかってきます。まれな事象に対して99パーセントの正確さを示すモデルは、本番環境では役立たずになり得るのです。

オッズをすばやく見積もる

実生活の確率の問いの多くは、正確な答えを必要としません。必要なのは、すばやくて筋の通った見積もりです。そこにたどり着くための動きを紹介します。

まず分数に変換し、その後でパーセントや小数にしましょう。「100に1つ」は1/100、つまり1パーセント、つまり0.01です。暗算のコツで取り上げたとおり、これらの変換に流暢になることは、最も投資効果の高いスキルのひとつです。なぜなら、ほぼすべての確率問題は、表記間の変換で締めくくられるからです。

必ずベースレートを探すこと。特に、誰かがまれな事象に対する正確さの数字を渡してきたときには。ベースレートが小さければ、その正確さの数字は誤解を招きます。

独立性を注意深く確認すること。実は一方が他方を駆動しているのに、独立に見える2つの事象があります（同じ患者の中の検査結果、同じセクター内の株、同じクラスの生徒たち）。事象が隠れた共通原因を持つとき、確率を掛け合わせると、答えは小さすぎたり大きすぎたりします。

「100万分の1」をストレステストにかけること。問いましょう: 何に対して、何人にわたって、どれくらいの期間で？「まれな」事象のほとんどは、機会を数えればまれではないのです。

練習はどう反射神経を作るか

確率はパターン認識が最も重要な話題です。なぜなら、同じ問題が20通りもの違う衣装を着てやってくるからです。さまざまな構造（独立対従属、復元あり対なし、条件付き対同時）を繰り返し見てきた生徒は、数秒で構造を見抜き始め、算数はその認識から自然に出てきます。

Math Zenのバケツ式進行システムは、この話題が本来学ばれたい仕方とぴたりと噛み合います。最初のバケツでは、単純な実験（ダイス、カード、コイン）の結果を数えることに取り組みます。中盤のバケツでは、和に対する加法則と積法則を反復練習し、混ぜた問題で脳が公式を盲目的に当てはめるのではなく状況を識別することを学ぶようにします。後半のバケツでは、条件付き確率、期待値、そして古典的な難問（誕生日のパラドックス、モンティ・ホール、ベースレート問題）に取り組みます。練習が短く間隔を空けて行われるので、構造を認識する機会が繰り返し得られ、それが最終的にルールを反射神経へと変えていきます。

結論

確率はひとつの考えに尽きます: 条件に合う結果を数え、存在するすべての結果で割り、数えている事象が本当に独立かどうかについて正直であり続けることです。「パラドックス」とは、直感が数学とは違うものを数えている状況にすぎません。事象が独立なら掛け算しましょう。どちらかが起こる確率が欲しいなら足し算しましょう（重なりを引いて、二重に数えないように）。新しい情報が入ってきたら条件づけしましょう。誰かが「100万分の1」を渡してきたら、必ずベースレートを探しましょう。

「何の100万分の1なのか、何に対して、何人にわたって？」と問い始めたとたん、日常の世界はかつてのような仕方ではランダムに感じられなくなります。宝くじは、まれにジャックポットが付いてくる小さな期待損失になります。医療検査は、ベースレートについての問いになります。連勝は、脳が因果関係の衣装を着せた偶然になります。数字は変わりませんが、その読み方は変わり、その変化は一生にわたって見返りを返してくれます。

確率を直感的に理解する（「100万分の1」があなたを欺く理由）

確率を直感的に理解する（「100万分の1」があなたを欺く理由）

たったひとつの考え: 数えること

独立な事象: 確率を掛け合わせるとき

事象が独立でないとき

誕生日のパラドックス

ベースレートと「100万分の1」のトリック

ギャンブラーの誤謬

確率はどこに登場するか

オッズをすばやく見積もる

練習はどう反射神経を作るか

結論

関連記事

分数を直感的に理解する（ピザの一切れに頼らずに）

本当に効果のある暗算テクニック（とその理由）

SAT数学の対策法：完全スタディプラン