「言葉の統計学者」と、少しばかりの雨男
最近のAIときたら、まるでSF映画のワンシーンみたいだ。何を聞いても、あっという間に答えを出してくる。小説も書けば、絵も描く。近所の喫茶店でマスターが「このAI、全知全能じゃないか」と呟いたのを聞いた。隣でコーヒーをすすっていた僕も、内心そう思った。
でも、知っているだろうか。全知全能どころか、彼らはただの「言葉の統計学者」に過ぎないということを。
ちょっと賢い占い師みたいなものだ。膨大な数の本やウェブサイト、SNSの書き込みを読み込んで、次にどんな単語を持ってくれば、最も自然で、最もらしく聞こえるかを延々と計算している。入力が「雨が降る」だったら、その次に「だろう」が来る確率は何パーセント、「にわか雨」はどうか、「傘を忘れた」はどうか、と。
彼らがやっているのは、言ってみれば、膨大な過去のデータという名の海を泳いで、「最も波の立ちそうにない場所」を教えてくれる作業だ。素晴らしい能力だとは思う。でも、それは「真実を知っている」のとは少し違う。真実なんて、たぶん誰にもわからないのだから。
問題は、彼らの学習する材料にある。
誰かが言った。「ネット社会で流布している情報は煮詰まって形を無くしたスープだ」と。うまい比喩だと思った。そのスープの中には、図書館で何十年も守られてきた真実のレシピもあれば、昨夜SNSで隣人がつぶやいた「うちの猫が喋った」というデマも、区別なくぐつぐつと煮込まれている。そしてAIは、そのスープの味付けを学習する。
彼らは書き手の顔や年齢、人種といった属性を直接は学習していない、とされている。それはそうだ。彼らは人間じゃない。ただの統計マシンなのだから。でも、でもですよ。もし、もしも彼らが学習するスープの具材が、ある特定の偏見で味付けされたものばかりで囲い込まれていたとしたらどうなる?
「女性はこうあるべきだ」とか、「こういう仕事は、きっとあの国の人に向いている」といった、社会に潜む陰湿なバイアスも、彼らにとってはただの「確率の高いパターン」として認識されてしまう。そして、そのパターンに基づいて、無意識のうちに偏った回答を弾き出す。
結局、僕たちはただの強力な道具を手にしているだけなのだ。自ら真実を創造する神様じゃない。「最もらしい答え」を探すための、優秀な探偵だ。ただし、その探偵が持っている捜査資料は、デマと真実がごちゃ混ぜになった、どこか胡散臭い裏通りの中華料理屋のまかない飯みたいなものだ。
だから、マスターに「全知全能だ」と耳打ちされたら、僕は肩をすくめてこう言うだろう。
「彼らはただの確率屋さんですよ。しかも、たまに嘘を吐くし、偏見も持っている。だけど、仕事はめちゃくちゃ速い。僕たちはその速さを利用するだけでいい。大切なのは、彼らの答えを鵜呑みにしない、というたった一つのシンプルなルールを忘れないことです」
傘を忘れた日に限って雨が降る確率を計算するように、彼らは今日も言葉を繋いでいる。僕たちはその横で、自分の頭で「本当にそうかな?」と考える。それで十分だ。全知全能なんて、小説の中だけで十分じゃないか。




