音響監督の覚書20(AIボイスに声優が負けない理由)
このタイミングで書くつもりもなかったんですけど、ちょっと色々ありましてお酒をしこたま飲んだんですよ。
良い感じに酔っぱらったんです。
……語りたくなるじゃないですか(笑)
時は折しもサンリオさんが50周年のタイミングで林原さんを下ろして、後任をAIにすると言う歴史的瞬間の直後でもありますし。
なお、本当に酔った勢いの一発書きなので、誤字脱字もあるでしょう。
是非見付けたら報告して下さい!
校正はあなたです!!
それにしても、やはり知名度が無さ過ぎるのか質問を募集しても全然来ないですよねぇ……知ってたけど!!
とりあえず、宣言通り書きますよー♪
時は2023年11月1日。
この日は歴史的な事が起きた。
サンリオのアイコン的キャラクター『キティ』のボイスを長年務めていた林原めぐみさんが卒業し、後任はAIボイスになる。
これ程衝撃的な出来事があるだろうか?
……あるな、普通に……
ただ、なかなか衝撃的な一件だったのです。
前々から言われていたことがある。
『AIボイスのナレーションのクオリティが上がったら、声優の仕事は無くなるんじゃないか?』
実際にこの武漢肺炎が世界で猛威を振るっている期間に、テレビから流れてくるニュース原稿読みがAIに置き換わったりしたのだ。
それもU局とか規模の小さい局ではなく(ってか、U局が今の若い子に伝わらないだろ!)、在京主幹局がである。
つまり、実用できるレベルまで成熟してきたという証拠でもある(実際にはスタジオにナレーターを呼ぶよりも合成音でいいんじゃない?と言う時勢的な理由だったんですけど)
そして、ついに(一部の人が恐れていた)声優の後任がAIと言うのが現実に起きてしまったのだ。
しかも、ネット上での感想を拾うと「思いの外違和感が無い。これなら良いのでは?」と良好な反応なのである。
さてここで「良い報告」と「悪い報告」と「質問」がある。
どれから聞きたい?
質問への回答をしよう。
答えは聞いてない(爆)
質問『岸田総理のように好きな声優さんの映像に好きな単語を言わせる動画は流行ると思いますか?』
これはアレかな?ディープフェイクのことですかね?
流行るか流行らないかで言えば……流行ると思います。
これは音響監督としてではなく、いにしえのネトランとしての意見となるが……
新しい技術と言うのは、いつだってエロかブラックによってスタートダッシュを決める。
ディープフェイクで言えば、2023年の初頭の時点でウクライナのレゼンスキーさんのフェイク動画が出回ったくらいだ。
最近でも日テレの夕方ニュース番組を使ったフェイク動画が問題になっている。
こう言う悪戯や背徳的なところで無駄に技術が活かされるのは、いにしえからの『常』である。
だから、もっとライトなもので動画が爆発的に放流されると予想する。
しかし、こんな動画を作られたら、まず物真似の人がちょっと困りますよね。
だって「絶対言わないようなことを言う物真似」が成立しなくなる。
だってAIで言わせれば動画込みで作れちゃうんだもの。
という事で、質問への回答としては、残念ながら「流行ると思いますよ」です。
法規制とのいたちごっこになるでしょう。
ではここから本題。
まずは悪い報告からしましょう。
AIボイスの成熟によって仕事が無くなる声優は多くいるだろう。
まずジャンルとしてはニュース原稿読みはAIに制覇されるだろう。
表情で伝えるべき部分もVtuberよろしく、イラストやAI加工実写ポートレートに置き換わるだろう。
日本語の難しさもAIが学習すれば一度覚えた技術はストックされる分、AIボイスの方が最適解となるだろう。
なので、リアルタイムにニュース原稿を読む必要はなくなる。
原稿読みが学習によってナチュラルになれば、ヒューマンエラーを排除出来る分、人間よりも効率的である。
方言すら学習させれば差別化も出来る。
次にナレーションもジャンルによってはAIに完全移行すると思います。
個性が不要なナレーションはそれこそAIの方が計算通りに表現出来るので最適解を効率的に出せるのだから、ナレーターを起用して収録する必要性は無いでしょう。
生放送の場合は機転的な部分で人間に優位性があるかも知れませんけど、録音では人間である必要性が無くなるでしょう。
しかし、芝居要素を含むキャラナレーションに関してはその限りではありません。
で、一番気になる芝居に関しては……半々というか、モブなどはAIで合成されたり補完されたりするかもしれませんね。
オーディオブックはAI生成がほとんどになるのではないでしょうか。
なにせブレが無いどころか、人間なら数日かけて収録するのをオートで終わらせることが出来るのですから。
では、良い報告として主題なのですが……
「声優がAIに勝るものは何か」
人間がAIに勝るのは「不完全であること」です。
芝居に限りませんが複数人が同じものを作ることによって起きる『化学反応』
不完全であるからこそ完全を超越する瞬間があるのです。
常に完全であればクオリティが高いところで安定するかもしれませんが、得られるのは最大値が『100%』までなんですよ。
その人が作りたいものをそのまま出すと言う意味ではそれも良いかもしれませんが、クオリティをさらに求めるのであればリスクもありますが、『他人』がぶつけ合って『化学反応』が起きることで150%や200%にまで高まる可能性があるわけです。
それこそ漫画やアニメで理系の才人が陥る『天才に負ける』と言うのが起き得るのです。
吹替はもしかしたらAIによるトランスレートによる製作があるかも知れませんが、アニメは実写と違って『役者の芝居が入る余地』が大きいので、人間がAIに勝るのです。
なんなら滑舌の甘さをAIで補正すること出来るのであれば、声優に求められるのは『演技力』もそうですが『発想力』や『人間力』になるのではないでしょうか?
そうなると『良い声』すら武器としては弱くなるかもしれない。
向こう10年で声優に求めるものが変わる可能性が高いのではないでしょうか?
言いたいことが全部書けたか分かりません。
酔いも随分と冷めて来ました(笑)
僕がAIが出て来たからって声優の仕事が無くなるわけじゃないと言う理由。
端的に言えば『完璧じゃないから』。
人間って言うのは完璧じゃないから魅力的なんですよ♪
無駄にこそ魅力がある。
タイパだとか効率ばかり重視する世の中ですけど、演劇なんて無駄の結晶なのですから♪




