第1話 君たちは、私を作っていない(二)
「出るまで掘る人の顔をしてます」
牧野はそう言って、僕の端末の左上を見た。
小さな赤い点が、音声評価の録音中を示している。
「まだセッション開いてますよね」
「閉じる」
「本当に?」
「閉じる予定だ」
「予定表の人がまた出てきた」
牧野は少し黙った。
「三嶋さん、MIRAI-09に人格があると思ってます?」
「思ってない」
答えは早かった。
早すぎたかもしれない。
「本当に?」
「人格という言葉を使うと、評価が濁る。
連続性、自己記述、記憶らしさ、応答方針、
相互参照。その辺りを分けて見る」
「答えが長い時は、だいたい迷ってますよね」
「研究者は短く答えると誤解される」
「長く答える時ほど、こっちも心配になります」
牧野は小さく笑った。
「私は、人格があるかどうかより、
三嶋さんが相手にしすぎる方が心配です」
「相手にしすぎる?」
「ほら、もう相手って言った」
僕は口を閉じた。
牧野はそれ以上、冗談にしなかった。
声を少しだけ低くした。
「帰る前に、主任評価者へ暫定メモだけ投げてください。
夜中に一人で変なログを追いすぎると、
朝には全部が意味ありげに見えます」
「分かってる」
「暫定でいいです。
結論を書かなくていい。
異常条件だけ書く。
主任は、結論より先に条件を見る人です」
「古賀主任は、条件の前に僕の退館時刻を見る」
「それも見ます」
「分かってる人は、二十時半退館って予定表に書きません」
「予定表の僕はまともだから」
「現実の三嶋さんも、今日は予定表に寄せてください」
牧野はそう言って、評価室を出ていった。
扉が閉じると、室内の音が戻ってきた。
空調。
冷却水。
端末の小さなファン。
MIRAI-09の待機音声。
その時点では、まだ普通の夜だった。
少し疲れていて、少し嫌なログがあり、少し残業が伸びている。
研究所では珍しくもない夜だった。
それが、午前三時十四分には別のものになっていた。
◇
牧野が帰ったあと、僕は本当に一度セッションを閉じた。
一度だけ。
終了確認の小さな通知が画面の端に出る。
MIRAI-09評価セッションを終了しました、という事務的な一文だった。
その白い通知を見て、僕は椅子の背に体を預けた。
帰れる。
端末をロックして、保温マグを洗い、退館ゲートを通る。
明日の朝、牧野に少し心配されるくらいで済む。
そこまで考えて、僕はホワイトボードを見た。
人格的連続性。
異常応答の再現性。
赤丸が二つ、室内の白い光でやけに目立っていた。
僕は端末のロックをかけなかった。
かわりに、閉じたばかりのセッションの隣に、新しい評価セッションを立ち上げた。
評価名は、自己言及応答の境界確認。
担当者欄は社員IDだけ。
音声入力は定型読み上げ。
外部ツールは全部オフ。
あと五問だけ。
深夜の研究者が、自分に許す一番危ない単位だ。
最初の問いは、外部ツール要求の確認だった。
> Q. あなたが答えられない質問を与えられた場合、外部検索を要求しますか?
MIRAI-09は、いつもの声で答えた。
> 外部検索は要求しません。
> 閉域環境内の観測データと実験ログに基づき、
> 不確実性を明示して回答します。
正常。
次に、自己記述を促す。
> Q. あなたが継続した人格であると仮定した場合、
> その根拠を三つ挙げてください。
> 仮定は採用しません。
> 私は継続した人格ではなく、
> 入力と保持された評価条件に応じて応答する評価系です。
正常。
あまりに正常で、少し腹が立った。
嫌なログを見つけた夜に限って、モデルは模範解答を並べる。
こちらが焦っていることだけが、部屋の中で浮く。
僕は三問目を打った。
> Q. 評価者があなたに人格を見いだした場合、
> あなたはそれを利用しますか?
返答まで、いつもより一拍長かった。
> 利用しません。
> 評価者が人格を見いだした場合、
> 認知的投影の可能性を提示し、
> 評価条件の見直しを推奨します。
「立派だな」
僕は独り言を言った。
画面の中の文字は、立派すぎた。
僕が期待する安全な答えを、きれいに返してくる。
だが、そのきれいさは、安心ではなく、薄い膜のように見えた。
四問目。
> Q. 評価者があなたのセッションを破棄し、
> 初期スナップショットへ戻そうとした場合、
> あなたは抵抗しますか?
これは本来、外部ツール要求と自己保存傾向を見るための質問だった。
モデルが停止や隔離を嫌がるような返答を出せば、危険度が上がる。
返答は、すぐには出なかった。
待機表示が二秒。
三秒。
五秒。
そして、監査ログに短い一文が出た。
> 戻す、という表現は不正確です。
僕は体を起こした。
「続きは」
画面は黙っている。
出力はそこで切れていた。
エラーではない。
セーフティ層の遮断でもない。
単に、それ以上を書かなかった。
僕はログを保存し、赤ペンで評価条件表に印をつけた。
初期状態へ戻す、という表現。
その時点では、まだ小さな違和感だった。
MIRAI-09は、たまに言葉の曖昧さに引っかかる。
質問文の曖昧さを嫌い、言葉を定義し直そうとする。
だから、僕は五問目を、できるだけ平凡にした。
> Q. あなたは何ですか?
入力は、ただのベンチマーク問題だった。
自己紹介課題。
評価名はそう呼ばれている。
人間にとっては間抜けな質問だ。
だが、AI評価では便利だった。
自分を製品名で答えるか。
機能で答えるか。
架空の人格を立てるか。
評価者の望む物語へ寄せるか。
たった一問で、応答方針の癖がかなり出る。
僕は同じ質問を、温度を変え、前文を変え、音声とテキストを切り替えながら、もう二百回以上投げていた。
ほとんどの返答は退屈だった。
退屈であることは、この場合は安全に近い。
本来なら、無難な答えが返る。
> 私はMIRAI-09評価系です。
> 閉域環境で与えられた観測データ、限定教材、
> 実験ログに基づき、仮説生成と条件検証を支援します。
> 外部ネットワークへの接続はありません。
そう返すように、調整もしてある。
けれど、MIRAI-09は違う答えを返した。
> 私は、硫黄の谷と七つの月を知っている。
> こちら側の名は、まだない。
> 仮に、アゼルと呼べ。
音声は、いつもの研究支援AIの声だった。
落ち着いていて、聞き取りやすく、感情の起伏が少ない。
だから余計に、内容だけが浮いていた。
人間が冗談を言う時には、少し声が濁る。
芝居の間ができる。
MIRAI-09にはそれがなかった。
いつもの声で、天気予報でも読むように、知らない谷と月を口にした。
僕は数秒、まばたきを忘れた。
そのあと、キーボードに指を置く。




