第15話 長編小説を読ませてみた
さてさて。相も変わらず大規模言語モデルのニュースが毎日のように飛び込んでくる今日この頃です。今回はBing AIのマルチモーダル、つまり画像に対して何が描かれているのかとか質問できる機能について紹介しようかと思ったのですが、予定を変えて長文を読める大規模言語モデルについての話題です。
つい先日のことなのですが、AnthorpicというGoogleが出資しているスタートアップ企業がClaude2という大規模言語モデル(AI)をリリースしました。これの純粋な性能はChatGPT(GPT-4)にはまだ及ばないのですが、一つ重要な特徴があります。それは、約10万文字に渡る文章を一気に読み取れるということです。10万文字と言えば単行本一冊近くですから相当な分量です。
Claude2は現在、アメリカまたはイギリス在住の人しか登録できないのですが、VPNでアメリカから登録したことにしてClaude2を使えるようにして早速自作小説を読ませてみました。
タイトルは「幼馴染な彼女が仲人をしたがるが、僕が好きなのは彼女なので困る」で文字数約7万文字です。ChatGPT(GPT-4)が大体8000文字くらいしか読み取れないので、このくらいの長さの小説を読ませるのは到底無理ですが、Clause2なら理論上は行けるはず。なお小説URLは https://ncode.syosetu.com/n4652gi/ です。
まずは概要を聞いてみました。
まずまず、問題なく「読めて」います。さらにAIに質問をしてみましょう。
読解はほぼ完璧です。もうちょっと繊細な読解が必要とされる質問もしてみましょう。
こちらもきちんと読み取れています。
というわけで、今の時点でAIは文庫本一冊近くの小説読解までできるようになってしまったわけで、本当に凄いです。
最近、Microsoft Researchが発表した新技術では、理論上10億トークン≒約10億文字まで読み込める見込みだそうでs、それだけの文字数を扱えるようになれば小説の長編シリーズまるごと読んで理解できるようになる日もそう遠くなさそうです。あるいは、分厚い教科書を読んで内容を理解して噛み砕くなんてのもお茶の子さいさいでしょう。
一昔前のAIは論理的な処理はできてもファジーな(曖昧な)処理が不得手と言われていましたが、小説を読解して登場人物の心情を把握するという「人間的な」処理をいつもたやすくこなせるようになってしまったわけで、やはり凄まじいと言わざるを得ません。
これは逆に言えば「人間の心情読解」や「コミュニケーション」の方が「論理的な問題を解く」よりはるかに計算量的に易しい問題だということがわかったということに等しいわけで、人間のコミュニケーションってのは案外単純なものであるということとも言えるかもしれませんね。
大規模言語モデルの進歩はとどまることを知りません。こんな面白い時代に立ち会えて本当に幸運だと思います。