火曜日生まれの男の子が...

子供を2人持つ母親に、「火曜日生まれの男の子がいますか?」と聞いたら、「はい」と答えた。もう1人の子供も男の子である確率は?

2010年7月、筆者が数学好きだということを知っていた職場の後輩から、帰り道にこんな問題を、答えは1/2でないという注釈付きで教わった。それに対して、筆者が夜中に結構悩んでやっと問題の意味を理解し、13/27だと計算したと送ったメールを先週発掘したので、今は亡き後輩を偲んでもう一度夜中にやってみたら、結構悩んだ。

例えば、上記の「火曜日生まれ」を取り除いて、問題を

子供を2人持つ母親に、「男の子がいますか?」と聞いたら、「はい」と答えた。もう1人の子供も男の子である確率は?
に変えると、問題の意味がわかってくる。2人の子供のどちらか一方について「男の子ですか?」と聞いたのではないので、もしどちらか一方だけが男の子であれば、この「はい」によって既に答えられているのである。「男の子がいますか?」に「はい」と答えられる確率は1/2ではなく3/4なので、その分、その中でもう1人も男の子である確率は1/2より低くなる。
従って、問題の意味は「少なくとも1人が男の子である」場合の中の「2人とも男の子である」確率であり、答えは(2人とも男の子である確率)÷(少なくとも1人が男の子である確率)= (1/4)÷(3/4) = 1/3ということになる。
図で書くと、次のように表せるだろうか。
少なくとも1人男の子がいるのは黄色部分3パターンであり、その中でもう一人も男の子なのは*部分1パターンだけなので、その確率は1/3である。
つまり、この問題も冒頭の問題も、母集団を限定した確率を問う問題、即ち条件付き確率の問題である。

従って、冒頭の問題の答えは、(1人が火曜生まれの男の子、もう1人も男の子の確率)÷(少なくとも1人が火曜生まれの男の子である確率) = ((1/14)*(1/2) + (1/2)*(1/14) - (1/14)2) / (1 - (1 - 1/14)2) = 13/27 となる。
同じように図で書くと、次のようになる。















男日
男月
男火
男水
男木
男金
男土
女日
女月
女火
女水
女木
女金
女土
母集団が黄色の部分に限定された場合の中の*の割合なので、13/27である。

すっきりして、きっと有名な問題なんだろうなと思って調べてみたら、ネタ元はBBC Newsの2010年6月の記事、"Tuesday boy"だとわかり、次のような問題文が書かれていた。

"I have two children. One is a boy born on a Tuesday. What is the probability I have two boys?"
記事の初めにこれの答えは13/27と書いてあるが、見た瞬間、この問題文だと答えは13/27にはならないのではないかと思った。
その違和感が何に起因するのかがはっきりとわからず、1週間悩んでいる。

冒頭の問題で、「はい」と答えた母親ばかり集めれば、確率は13/27になることは、例えば次のようなプログラム(in Python)でシミュレーションすれは確認できる。

from random import randint

N = 100000
n = 0
hit = 0
while n < N:
    boy1 = randint(0, 1)	# 1: boy, 0: girl
    day1 = randint(1, 7)	# 1: Sun, 2: Mon, 3: Tue, ...
    boy2 = randint(0, 1)
    day2 = randint(1, 7)
    if boy1 == 1 and day1 == 3:
        n += 1
        if boy2 == 1:
            hit += 1
    elif boy2 == 1 and day2 == 3:
        n += 1
        if boy1 == 1:
            hit += 1

print(hit / N)
ではBBC Newsの問題はこのシミュレーションに当てはまるだろうか?と考えると、筆者には当てはまるように思える時もあるし、そうでないように思える時もある。

筆者にとって、BBC Newsの問題の違和感の原因の1つは、"born on a Tuesday"といった情報が親から自発的に付け加えられていることである。これによってもう一方の子が男の子である確率が1/3から変化するのであれば、親がその"a boy"に関する情報をさらに付け加えればまたもう一方の子に関する確率が変化することになる。

"One is a boy"に情報を付け加えれば付け加えるほど、重複する確率が下がり、求める確率は1/2に近づく。「少なくとも一方が」の意味が薄れ、もう一方の子の情報が無くなっていくとも言えよう。そうであれば、用いるべきは最も求める確率を左右する情報である"One is a boy"のみではないか、従って求める確率は1/3ではないかと思えてくる。
逆に、"One is a boy"も自発的に出された情報なので、「少なくとも1人は」男の子という意味で出されたのでない、例えば年上の子など、1人だけについて言ったものかも知れないと考えれば、もう1人については何も情報が無く、答えは1/2のように思える。

それに対し、冒頭の問題では水曜日生まれの男の子がいても「はい」とは答えられなかったので、「火曜日生まれ」という情報を無視することはできないし、どちらの子かを特定せずに質問したので、「少なくとも1人は」火曜日生まれの男の子だということになり、条件付き確率は間違いなく13/27である。


上記のBBC Newsの記事には、たくさん人を集めて、子供が2人いる人に立ってもらい、少なくとも1人が火曜日生まれの男の子の人以外は座ってもらったら、2人とも男の子の人は27人中13人だが、同様に子供が2人いる人に立ってもらい、少なくとも1人が男の子の人以外は座ってもらい、ランダムに1人選んで、1人の男の子が生まれた曜日を答えてもらったら火曜日だった場合は、立ってる人の中で2人とも男の子の人は3人中1人、というように、問題文をどう読むかによって答えが変わることが書かれているが、答えが2人中1人になる読み方、例えば子供が2人いる人に立ってもらい、ランダムに1人選んで、子供の1人の性別と生まれた曜日を答えてもらったら男の子で火曜日だった場合が書かれていない。
しかし、筆者は最初にBBC Newsの記事の問題を見た時には答えが1/3だと思ったが、色々考えた後では、同じ問題文を見て答えが1/2と思うことの方が多くなった。

BBC Newsの記事の問題も、これを数学の問題だと割り切って、出題者の意図を汲み取りながら考えれば、答えが13/27となる読み方に収束していくだろうが、それにしても、冒頭の問題文の方が幾分ましだが、これらが条件付き確率を問う問題だと理解するのはかなり難しいように思う。