第二章 乖離マップ
依頼仕事の中に、ときどき「当たり」がある。
当たり、というのは報酬が高いとか、評価点が多いとか、そういう意味ではない。データの中に、思いがけない窓が開いているような仕事のことだ。
その日の仕事は、都市国家内の教育関連企業からの依頼だった。内容は単純で、複数のデータベースから特定の年齢層の試験成績推移を抽出し、グラフ形式に整形するだけだ。ソラに半分任せれば午前中に終わる量だった。
しかし作業を始めて二時間ほどで、レンの手が止まった。
「ソラ」
「はい」
「このデータ、ちょっとおかしくないか」
画面には、十五歳から二十歳にかけての試験成績の推移グラフが並んでいた。依頼された通りの形式に整形されたデータだ。数字に間違いはない。しかし——
「七歳時の企業買取価格と、二十歳時点の持ち点の相関を出してみてくれ。同じデータセットで」
「依頼内容に含まれていない処理ですが」
「わかってる。確認したいだけだ」
数秒の処理の後、新しいグラフが表示された。
レンはしばらく、それを見ていた。
散布図の中に、明確な傾向があった。七歳時の買取価格が高い層ほど、二十歳時点の持ち点が高い。単純な正の相関だ。それ自体は、驚くことではない。高く売れた子どもは、それだけ充実した教育環境にいたということだろう。
問題は、外れ値だった。
買取価格が低い層の中に、持ち点が突出して高い個体がいくつかある。逆に、買取価格が高い層の中に、持ち点が思いのほか低い個体もある。それも予想の範囲だ。
しかし、もう一つ別の変数を重ねてみると——
「素体スコアのデータ、持ってる分だけでいい。この散布図に重ねてくれ」
「持っている範囲は全体の約十二パーセントです」
「それで十分」
グラフが更新された。素体スコアが高い個体を、別の色でマーキングする。
レンは画面に顔を近づけた。
買取価格が低く、素体スコアが高い層——つまり、「生まれた可能性は大きかったが、安く売られた」グループが、散布図の左下に密集していた。二十歳時点の持ち点は、低い。平均以下の者も少なくない。
逆に、買取価格が高く、素体スコアが平均的な層は、散布図の右上に広がっていた。持ち点は高い。
「……なあ、ソラ」
「はい」
「これ、どう読む」
ソラはすぐには答えなかった。
「素体スコアの高さと実績スコアの間に、買取価格が介在しているように見えます」
「介在、というより」
「媒介、かもしれません」
レンは椅子の背もたれに体を預けた。
素体スコアは、生まれた瞬間の「可能性」だ。努力も環境も関係ない、ただの出発点。それが高くても、七歳で安い値段をつけられれば——つまり生みの親の持ち点が低く、カリキュラムに金をかけられず、AIログが薄ければ——その可能性は数字として実現しない。
逆に、素体スコアが平均的でも、高い買取価格がつけば——充実した環境、豊富なカリキュラム、厚いAIログ——実績スコアは伸びていく。
つまり制度が「評価している」のは、出発点の可能性ではなく、その可能性に投資された「資本」の大きさだ。
「これ、公開されてるデータから取れる範囲でどこまで広げられる」
「かなり広げられます。素体スコアの公開範囲は限られますが、買取価格と実績スコアの相関だけなら、大部分の登録者データから算出可能です」
「やってみてくれ」
「どの程度の規模で」
「全部」
またソラが黙った。今度は少し長い沈黙だった。
「……全登録者は約三百万人です。処理に時間がかかりますが」
「夜中までにできる?」
「できます」
「じゃあ頼む」
レンは依頼仕事の画面に戻った。こちらはあと一時間もあれば終わる。
しかし手を動かしながら、頭の別の部分が回り続けていた。
この傾向が、本当に全登録者規模で確認されたとして——何が変わるか。変わらない、かもしれない。制度は「公平だ」と言い続けるだろう。試験は誰でも受けられる。評価点は誰でも贈れる。選挙は誰でも参加できる。形式の上では、一切の差別がない。
でも数字が言っている。
生まれた可能性の大きさは、実績の大きさに反映されていない。反映されているのは、その可能性に注がれた「投資」の量だ。
投資の量は、生みの親の持ち点によって決まる。
持ち点は、制度が決める。
制度は、公平だ。
この論理の環の中に、見えていないものがある。
レンはそれをまだ言葉にできなかった。しかし数字は確かに、何かを映していなかった。
---
夜の十一時過ぎ、ソラが報告した。
「全登録者データの処理が完了しました」
「見せて」
画面いっぱいに、散布図が展開した。三百万の点が、淡い光の粒のように並んでいる。
レンはしばらく、それを見ていた。
傾向は明確だった。十二パーセントのサンプルで見えていたものが、三百万のデータで輪郭をはっきりさせた。買取価格の低い層が左下に集まり、高い層が右上に広がる。そしてその傾きの中に、素体スコアの高低が、統計的に有意な影響を与えていない。
影響を与えていない——というのは正確ではない。影響は確かにある。しかし買取価格という変数が、その影響を大幅に上書きしている。
「これに名前をつけるとしたら」レンは言った。
「データ名称ですか」
「違う。このパターン全体に」
ソラが少し考えた。
「乖離、でしょうか。あるべき相関と、実際の相関の間の——」
「乖離マップ」
レンは端末にそう打ち込んだ。
ファイル名:乖離マップ_v0.1
保存した。
その夜はそれ以上何もしなかった。データを誰かに見せるわけでも、どこかに送るわけでも、発表するわけでもない。ただ、名前をつけて、保存した。
それだけだった。
それだけで、何かが始まった気がした。




