ずんだもん動画が、やっと脚光を浴びて、ようつべで無限増殖している件について
まず、ずんだもんは、ボイスボックスという、ゆっくりボイスのような奴と同じだとイメージすれば、分かり易い。
だが、ゆっくりボイスよりも、より人間らしい可愛い声を出せるようになった、進化バージョンって感じだ。
ゆっくりボイスは、それはそれで長年使われてきて、市民権やその他のノウハウが詰まっているので、それはそれで悪くない。
でもやはり、ずんだもんのボイスを聞けば分かるのだが、圧倒的に聞き心地が違う、段違なのだ。
ずんだもんはボイスボックスの沢山あるキャラクターボイスの、1ボイスでしかないのだが、
それでもボイスボックスでキャラクターボイスを探したり、見る時に、一番トップの最初に出てくるのが、ずんだもんである。
ボイスボックス内では、一番の市民権やらノウハウ・安定度などの技術は、あるっぽい(?)のだ。
さて、筆者は数年前から、ボイスボックスの技術は、一つ突き抜けて、実用性が高く、実践的に”使える技術”だと、知っていた。
数年前にエッセイでも言及したことが、あると思う。
優位点は、まず変換の高速性だ。
例えば、ゆっくりボイスは、文字を入力してから、ゆっくりボイスになるまで、今のPCなら、ほぼノンタイムで変換可能だ。
だが、ちょっと高度な音声合成を生成しようとして、ゆっくりボイスよりも、より人間らしい声を出そうとすると、途端に処理が重くなるのだ。
その為にCPUだと足りず、ほとんどの音声合成ソフトは高価なGPUを求めているのが実情だ。
だがボイスボックスは、CPUや低価なノートパソコンでも、高速な音声合成が可能で、処理が軽く、尚且つ高品質な音声合成が可能なのだ。
そして、今の「ずんだもん動画」がバズっている話に移るのだが。
だーまめ、という人が第一人者らしい、この人の動画は、超絶高品質で、「ずんだもん動画」がバズった先駆け的な人なのだろう。
見れば分かるのだが、従来の「ゆっくり動画」よりも、隔絶した表現力を、ボイスボックスのずんだもんにより、表すことができるようになっているのだ。
その後の展開は分かり易い、だーまめ氏の二番煎じを狙って、無数の人達が「ずんだもん動画」を作りまくっているのだ。
クラウドソーシングを見ると、夥しい人達が、「ずんだもん動画」を作りませんか?と案件を飛ばしまくっているのだった。
これはボイスボックスが、低価なPCでも使用可能な事が大きな理由だと、個人的に思っている。
他の音声合成ソフトだと、高価なPCが必須なのだが、「ずんだもん動画」製作には必要ないのだ、むしろスマホですら作れてしまうかもしれない(*要検証)。
さらに末恐ろしいのは、ずんだもんは所詮、ボイスボックスが提供する、一キャラクターでしかないのだ、という点。
他にも魅力的なキャラクターは居て、筆者が昔エッセイでとり上げた「九州そら」の「ささやき」タイプのボイスは、それだけでASMRとして売り出せる位に凄く、汎用性も高そうだったのだ。
現に「ずんだもん動画」には、「九州そらに囁かれて絶頂するずんだもん」という動画があったくらいだ(笑)、気品のある大人な声という、公式の説明も間違いじゃないのだろう。
九州そら以外にも、25種類くらいのキャラクターボイスがあり、実際のボイスの完成度や安定度は、あまりよく知らないのだが、
ずんだもん以外にも、ボイスボックスが提供するキャラクターボイスを使った動画の制作に、個人的に期待が高まっている。
というよりも、ボイスボックスに限らず、他の音声合成ソフトと組み合わせて、広く市民権のあるキャラクターのボイスというものが、広まったら良いな、というのもある。
動画を作る上で、市民権のないボイスは好かれないからだ。
「ずんだもん動画」でも、ずんだもん以外のメジャーな音声合成の有名所のキャラクターボイスが使われて「あーこの声聞いた事がある」ってので、親近感を覚えやすかった気がする。
ゆっくりボイスは勿論筆頭で、その他にも「結月ゆかり」「初音ミク」ボイスなどなどが、あったような、無かったような。
とにかく、使われれば使われるほど、音声合成のノウハウや技術は、蓄積するモノだと思っている。
音声合成の「ずんだもん」は「このフレーズ」は出し易いとか、その程度のミクロなものだけじゃなく、
資金や人材が集まれば、より高度なソフトもできるのではないか? という話も含む。
そして更に高度な面白い動画ができるようなれば、みんな幸せになるのは、これは間違いようが無いほど確実だ。
それを確信できる位に、最近「ずんだもん動画」のバズり具合や発展は、眼を見張るものがあるのだった。