15. 最小二乗法
いよいよデータがそろったので、今後のワイン価格を予測するために、回帰分析というものを行う。
回帰分析を説明する際によく用いられるイメージは、XY平面に散らばったデータの真ん中あたりに線を引いて、XとYの関係を調べるものだ。今回の場合、Y軸がワインの価格で、X軸は降水量や平均気温になる。「真ん中あたり」の決め方はいろいろとあるが、その中でも最も基礎的なものが最小二乗法、通称OLSだ。
ケネスは前世の大学院で、入学早々このOLSについて学んだことを思い出していた。
「——以上より、OLSは最良線形不偏推定量であることが示された」
黒板に証明を書き終えた教授は、そう言うと仏頂面で学生のほうを向いた。
「諸君らは今たいそうな手法を教えてもらったと勘違いしているだろう?」
教授の不機嫌な声音を聞いてなにごとかと顔をあげた学生らをにらみつけるようにして、彼は話を続けた。
「いろいろと数式を書いたけどね、OLS自体は所詮、相関関係を見るための道具に過ぎないわけだ。そういう基本的なことを忘れて、考えなしにOLSを走らせただけの修士論文が毎年量産されることに私は疲れているんだよ」
心底うんざりした顔の教授に隆太郎が少々気おされていると、突然ひとりの学生が指名された。
「いろいろな学生の知能指数を、住んでいる家の面積にOLSで回帰したとしよう。結論はどうなる? そこの君」
黒縁眼鏡の男子学生は少々おどおどしながらも答えた。
「えーと、そのふたつは普通は正の関係にあるので、係数はプ、プラスになると思います」
「そのとおり。この場合、頭のいい学生は大きな家に住んでいるよ、という傾向を回帰分析の結果は表しているにすぎないわけだ」
そしてため息をひとつつくと、教授は心底不思議でしょうがないといった面持ちで問いをたたみかけた。
「なぜ君たちは、その結果を自分の都合よく解釈して『大きな家に住むと頭がよくなる』などという馬鹿げた論文を書いてしまうんだろう?」
「なぜ君たちは、そういう論文を書いてしまう前に、他になにか理由がないのか、考えてみようともしないんだろう?」
「なぜ君たちは、知能指数の高い学生は親の所得が高いから、ただ単に家も大きいのかもしれないとは考えないんだろう?」
教壇からひととおり鬱憤を晴らした教授は、最後にこう宣言して授業を終えた。
「いいか、よほど特殊な状況でもない限り、ただのOLSをメインの分析に使うのは禁止だからな」
ワインの価格予測というのはこの「よほど特殊な状況」にあたる。理由はいくつかあるが、一番は分析の目的がシミュレーションではなくただの将来予測であることだ。
巷のイメージとは裏腹に、経済学界では単なる将来予測が意義を持つことは少ない。基本的に、経済学とはどうすれば人々はもっと幸せになれるのか、を考える学問だからだ。そのためには、将来世の中がどうなるのか予測するだけではなく、「何かを人為的に変えた時に」世の中がどうなるのかシミュレーションをしなくてはならない。
教授が出した例の場合、大きな家に住んでいる学生は頭がいいのか推定するだけではダメで、ある学生が大きな家に引っ越すと頭がよくなるのかを調べなければ、あまり意味のある結果とは言えないわけだ。
そして教授が諭したように、後者を調べるような分析の道具としては、基本的には相関を見るだけのOLSでは不十分なことが多い。たとえば、仮に子どもの知能指数を決めるのが親の所得であったときに、親の所得が変わらないのに無理をして大きな家に引っ越しても、子どもの知能指数に影響はないからだ。それにもかかわらず、親の所得を考慮せずにOLSで分析してしまうと、あたかも大きな家に引っ越せば学生の頭がよくなるかのような分析結果が得られてしまう。
それならば、親の所得を考慮に入れてOLSを用いればいいというのが自然な考えだが、本格的に計量経済学を学んだ者であればそれが甘いことを知っている。子どもの知能指数と家の大きさ両方に影響を与えうる要因は他にもたくさんあるからだ。
たとえば住んでいる地域や祖父母の同居といった要因があるが、最も厄介なのは分析する者が気づきもしない隠れた要因だ。気づいてもいない要因を変数として分析に含めるのは不可能であるため、OLSという手法自体があまり適していないということになる。
今のケネスにこういう心配はあまりいらない。知りたいのは単にワインの将来価格であって、何かを人為的に変えた時にその価格がどう変動するかではないからだ。
そういう使い方をする場合は、OLSでも本質的に間違った推定方法ではないので、安心して分析を進めることにした。
数日間にわたる地道な計算を進めながら、ケネスは奇妙な安寧を感じていた。
隆太郎のように、学術的に新しい分析を行わなければならないという制約もなければ、焦燥感を煽る同級生の活躍もない。
純粋に自分が儲けるのに必要な計算を淡々と進める状況が心地よいのだ。まだ幼いので、この試みが失敗したとしてもまだやり直せるという確信もある。
また、大学院で学んだ理論的な知識が役に立っているという充実感もあった。
前世では、データ分析には基本的にソフトウェアを使用していた。必要なツールはパッケージになっているので、OLSのような基本的な分析なら、それほど専門的な知識がなくても推定結果を出すことはできる。
しかし、今ケネスが行っているように手計算で推定するには、OLSの公式を暗記したうえで、基本的な行列の計算をする必要がある。隆太郎が大学院に進学していなかったら、もう少し簡略な方法でお茶を濁すしかなかっただろう。
計算が終わると、思った通りの結果を得ることができた。つまり、マーリーズ領のワインも前世のボルドーワインと同じように、生育期に気温が高く、収穫期に降水量が低いと、ワインの価格は高くなるということである。係数は微妙に異なるものの、価格を予測するのに支障はなさそうである。
いざ分析を完了させると、ケネスはしばらくすべきことがないことに気づいてしまった。ワインを事前に買い付けるチャンスはぶどうの収穫期にしかやってこないし、その年に生産されるワインの質が平均よりも大きく優れているか劣っていないと、予測の威力が発揮されないからだ。
しかたがないので、ケネスは隆太郎の経済学に関する知識を書き留める作業に時間を費やすことにした。前世の記憶がよみがえって数年も経つと、徐々に記憶が薄れてくることに気づいたからだ。
機会は翌々年に巡ってきた。夏に気温の高い日が南方地域で続いたという報告をファーガソンから受け、秋には晴天の日が多かったという連絡を神殿から受けたケネスは、いよいよ行動を起こすことにした。ケネスが10歳になって数ヶ月が経った頃だった。