あの子が、君を好きな確率(ベイズ確率の話)
やあ、樋口諭吉だ。今日は、おれの趣味の話を語ろうと思う。
え? 知ったこっちゃない? ブラバしよう? 待て! 待て! せっかちすぎるぜ? お前は俺か? ちゃんと面白くするから聞いてくれ。
おれの趣味のひとつ、それは『未来予測』だ。
占いじゃないぞ。
今、君の目の前にある箱に予想させるんだ。スマホだとちょい処理速度が厳しいかな? そう、実はおれのパソコンには、人工知能のプログラムが入っている。おれは生粋の文系人間だし、数学とか超苦手だ。でも、趣味が講じて、ディープラーニングに行き着いちまった。
今日は、そこに行き着く過程で、見つけたおもしろいものを、取りあげてみようと思う。
ただ、作者のおつむには限界があるので、不正確な内容になってたらごめん。
みんなは、ベイズ理論って聞いたことがあるかな? メーラーでサンダーバードを使ってる人は、迷惑メールを仕分ける、ベイジアンフィルタなるものを耳にしたことがあるかも知れないね? それに使われている理論だ。
難しそう?
安心してくれ。おれでもわかる。君もわかる。
例えば、細い道を、男が通ってきたとする。
最初に来たのは男。次も男。さらに次も男だ。
その次に通るのは、男性か、女性か。
男女の総数を半々とするなら、確率論的には次に来るのは女性だよね?
じゃあ、こう考えてみよう。その細道は、街灯もなく、薄暗い。左右は茂み。人通りも少ない。しかも時間は夜だ。さあ、次に来るのは本当に女性か?
これが、一般的な確率論の限界だ。
じゃあ、ベイズ理論(ベイズ確率・ベイズ推定)では、どうか?
実は、ベイズ理論では、次に来るのも男性なんだよね。
ベイズ理論では、直前に出た確率を新しい数式にぶっこんで、次々と確率を更新していくんだ。
しかも、ベイズで使われる確率は、主観確率と言って、普通の確率じゃない。
「おれはこう思うぜ!」みたいな、俺確率でもいいんだ。
例をあげてみよう!
例えば君が消しゴムを落としたとする。
すると、彼女がニコニコしながら消しゴムを拾ってくれた。
ときめいちゃうよね? ときめいちゃうよね?
いや、ちょっと待て。
「あの子が、好きじゃない男の消しゴムを拾ってくれる確率」は、えーと、前にビリーが落としたときは拾ってた。ロブのは無視した。ヘンリーのも無視した。じゃあ、33%か。じゃあ彼女が俺を好きな確率は、ざっくり66%だぁ!
こんな確率を、数式に事前確率として突っ込んで計算していくんだ。
「あの子は、毎朝君に手を振ってくれる!」
ときめいちゃうだろ? 知ってるんだぞ!
だが、ちょっと待て。
「あの子が、好きじゃない男に毎朝手を振ってくれる確率」は、えーと、ビリーには手を振ってる。ロブは無視する。ヘンリーも無視する。ペリーには振ってる。50%か~。じゃあ、彼女が俺を好きな確率も50%かぁ。
オーノー。計算したら、彼女が俺を好きな確率が下がっちまったぜ。
こんな感じ。
これを積み重ねて、最終的に、あの子が君を好きな確率を割り出す。
え? 旦那が浮気してる確率? もちろん出るよ?
「浮気してない旦那のシャツに口紅がつく確率」は、えーと、旦那と同じ時間帯の満員電車に100回乗ったけど、シャツに口紅がついたのは5回だけだった。じゃあ、5%か。逆に、旦那が浮気している確率は、ざっくり95%だぁ!
とかね。
これらは、一つ一つでは、ただの思いこみの範疇だが、積み重ねて、計算を繰り返していくと、さっきの細道の通行人の例のように、もっともらしい確率が出るんだ。ちなみに数が多くなればなるほど精度が上がるぞ。
ちょっと面白くないかな?
マイク○ソフトのビ○・ゲイツがベイズ理論を超絶に押しててさ、21世紀のマイクロソフトの基本戦略はベイズテクノロジーだ! みたいなことを言ったらしいよ。
ベイズの数式は簡単だし、エク○ルか、LibreOfficeみたいな、フリーウエアのエ○セルの『ばったもん』があれば、簡単に計算できるよ。
興味のある人はググってみてね。
あと、『いたもん』もよろしく! これで、いたもんのブクマが増える確率は100%だぜ!