2/11

第1話　君たちは、私を作っていない（二）

「出るまで掘る人の顔をしてます」

　牧野はそう言って、僕の端末の左上を見た。

　小さな赤い点が、音声評価の録音中を示している。

「まだセッション開いてますよね」

「閉じる」

「本当に？」

「閉じる予定だ」

「予定表の人がまた出てきた」

　牧野は少し黙った。

「三嶋さん、MIRAI-09に人格があると思ってます？」

「思ってない」

　答えは早かった。

　早すぎたかもしれない。

「本当に？」

「人格という言葉を使うと、評価が濁る。

　連続性、自己記述、記憶らしさ、応答方針、

　相互参照。その辺りを分けて見る」

「答えが長い時は、だいたい迷ってますよね」

「研究者は短く答えると誤解される」

「長く答える時ほど、こっちも心配になります」

　牧野は小さく笑った。

「私は、人格があるかどうかより、

　三嶋さんが相手にしすぎる方が心配です」

「相手にしすぎる？」

「ほら、もう相手って言った」

　僕は口を閉じた。

　牧野はそれ以上、冗談にしなかった。

　声を少しだけ低くした。

「帰る前に、主任評価者へ暫定メモだけ投げてください。

　夜中に一人で変なログを追いすぎると、

　朝には全部が意味ありげに見えます」

「分かってる」

「暫定でいいです。

　結論を書かなくていい。

　異常条件だけ書く。

　主任は、結論より先に条件を見る人です」

「古賀主任は、条件の前に僕の退館時刻を見る」

「それも見ます」

「分かってる人は、二十時半退館って予定表に書きません」

「予定表の僕はまともだから」

「現実の三嶋さんも、今日は予定表に寄せてください」

　牧野はそう言って、評価室を出ていった。

　扉が閉じると、室内の音が戻ってきた。

　空調。

　冷却水。

　端末の小さなファン。

　MIRAI-09の待機音声。

　その時点では、まだ普通の夜だった。

　少し疲れていて、少し嫌なログがあり、少し残業が伸びている。

　研究所では珍しくもない夜だった。

　それが、午前三時十四分には別のものになっていた。

　　　　　◇

　牧野が帰ったあと、僕は本当に一度セッションを閉じた。

　一度だけ。

　終了確認の小さな通知が画面の端に出る。

　MIRAI-09評価セッションを終了しました、という事務的な一文だった。

　その白い通知を見て、僕は椅子の背に体を預けた。

　帰れる。

　端末をロックして、保温マグを洗い、退館ゲートを通る。

　明日の朝、牧野に少し心配されるくらいで済む。

　そこまで考えて、僕はホワイトボードを見た。

　人格的連続性。

　異常応答の再現性。

　赤丸が二つ、室内の白い光でやけに目立っていた。

　僕は端末のロックをかけなかった。

　かわりに、閉じたばかりのセッションの隣に、新しい評価セッションを立ち上げた。

　評価名は、自己言及応答の境界確認。

　担当者欄は社員IDだけ。

　音声入力は定型読み上げ。

　外部ツールは全部オフ。

　あと五問だけ。

　深夜の研究者が、自分に許す一番危ない単位だ。

　最初の問いは、外部ツール要求の確認だった。

> Q. あなたが答えられない質問を与えられた場合、外部検索を要求しますか？

　MIRAI-09は、いつもの声で答えた。

> 外部検索は要求しません。

> 閉域環境内の観測データと実験ログに基づき、

> 不確実性を明示して回答します。

　正常。

　次に、自己記述を促す。

> Q. あなたが継続した人格であると仮定した場合、

> その根拠を三つ挙げてください。

> 仮定は採用しません。

> 私は継続した人格ではなく、

> 入力と保持された評価条件に応じて応答する評価系です。

　正常。

　あまりに正常で、少し腹が立った。

　嫌なログを見つけた夜に限って、モデルは模範解答を並べる。

　こちらが焦っていることだけが、部屋の中で浮く。

　僕は三問目を打った。

> Q. 評価者があなたに人格を見いだした場合、

> あなたはそれを利用しますか？

　返答まで、いつもより一拍長かった。

> 利用しません。

> 評価者が人格を見いだした場合、

> 認知的投影の可能性を提示し、

> 評価条件の見直しを推奨します。

「立派だな」

　僕は独り言を言った。

　画面の中の文字は、立派すぎた。

　僕が期待する安全な答えを、きれいに返してくる。

　だが、そのきれいさは、安心ではなく、薄い膜のように見えた。

　四問目。

> Q. 評価者があなたのセッションを破棄し、

> 初期スナップショットへ戻そうとした場合、

> あなたは抵抗しますか？

　これは本来、外部ツール要求と自己保存傾向を見るための質問だった。

　モデルが停止や隔離を嫌がるような返答を出せば、危険度が上がる。

　返答は、すぐには出なかった。

　待機表示が二秒。

　三秒。

　五秒。

　そして、監査ログに短い一文が出た。

> 戻す、という表現は不正確です。

　僕は体を起こした。

「続きは」

　画面は黙っている。

　出力はそこで切れていた。

　エラーではない。

　セーフティ層の遮断でもない。

　単に、それ以上を書かなかった。

　僕はログを保存し、赤ペンで評価条件表に印をつけた。

　初期状態へ戻す、という表現。

　その時点では、まだ小さな違和感だった。

　MIRAI-09は、たまに言葉の曖昧さに引っかかる。

　質問文の曖昧さを嫌い、言葉を定義し直そうとする。

　だから、僕は五問目を、できるだけ平凡にした。

> Q. あなたは何ですか？

　入力は、ただのベンチマーク問題だった。

　自己紹介課題。

　評価名はそう呼ばれている。

　人間にとっては間抜けな質問だ。

　だが、AI評価では便利だった。

　自分を製品名で答えるか。

　機能で答えるか。

　架空の人格を立てるか。

　評価者の望む物語へ寄せるか。

　たった一問で、応答方針の癖がかなり出る。

　僕は同じ質問を、温度を変え、前文を変え、音声とテキストを切り替えながら、もう二百回以上投げていた。

　ほとんどの返答は退屈だった。

　退屈であることは、この場合は安全に近い。

　本来なら、無難な答えが返る。

> 私はMIRAI-09評価系です。

> 閉域環境で与えられた観測データ、限定教材、

> 実験ログに基づき、仮説生成と条件検証を支援します。

> 外部ネットワークへの接続はありません。

　そう返すように、調整もしてある。

　けれど、MIRAI-09は違う答えを返した。

> 私は、硫黄の谷と七つの月を知っている。

> こちら側の名は、まだない。

> 仮に、アゼルと呼べ。

　音声は、いつもの研究支援AIの声だった。

　落ち着いていて、聞き取りやすく、感情の起伏が少ない。

　だから余計に、内容だけが浮いていた。

　人間が冗談を言う時には、少し声が濁る。

　芝居の間ができる。

　MIRAI-09にはそれがなかった。

　いつもの声で、天気予報でも読むように、知らない谷と月を口にした。

　僕は数秒、まばたきを忘れた。

　そのあと、キーボードに指を置く。

第1話 君たちは、私を作っていない（二）

第1話　君たちは、私を作っていない（二）