ChatGPTで理想の小説の挿絵を生成する事ができるようになった件について語る
まず、今現在ChatGPTの無料版で生成できる画像は一日に数枚程度らしいが、それでも理想に最も近い生成ができた。
具体的な指示文と結果出力が以下。
以下のようなシーンを画像生成して、二次元アニメ調のタッチでお願いします。
多階層、プラットホームにて、今日も沢山の声が飛び交っている。
それぞれの席にはオペレーターが、それを指揮する美しく可愛い少女がいます。
↑この指示に対して、ChatGPTが自分で画像生成するための指示文(これをプロンプトと言う)を自分で生成してくれる、それが以下の流れ。
このシーンを描くための画像生成リクエストを以下のように準備します。
A multi-layered platform bustling with activity. In the foreground, you see various seats with operators, each focused on their tasks. Overseeing the operation is a beautifully cute young girl with a commanding yet gentle presence, standing prominently and guiding the operators. The environment has a vibrant, futuristic feel with soft, warm lighting that highlights the energy of the scene. The overall style is in a 2D anime aesthetic with detailed character designs and expressive features.
この内容で画像を生成しますね。
↑ということらしい、多分、日本語をそのまま画像生成する機能に指示文として突っ込む、入力すると上手くいかないからだろう。
英語に翻訳するにしても、日本語から英語の翻訳は破綻することも多いので、ChatGPTがその辺に配慮して、日本語から推測される英語を画像生成するたびに作ってくれている。
画像が生成されました。希望されるシーンが描かれているかご確認ください。
思っていたのと、ちょっと違う感じに出来あがった。
しかし、大枠はこのような感じで進めてもらいたい、その場合は追加で指示することで可能なのだろう。
ここで少し工夫が必要で、日本語で指示すると破綻しやすい。
先ほどのようにCHATGPTが色々してくれるが、今回のように色々と指示が積み重なってくると、さらに破綻しやすい。
最近のCHATGPTは応答速度も重視する傾向があるので、指示が積み重なって応答自体が遅くなると中途半端な応答を返すことが多い。
恐らく多分、遅くなるくらいなら早くレスポンスした方が良い状況が多いので、このような応答になる。
ということで、英語で指示する。
といっても、日本語を英語にグーグル翻訳して、それを微調整して英語にするだけである。
あまり込み入った複雑な日本語を機械翻訳すると文脈などが破綻して、AIが読めない、読めないだけならいいが間違った解釈をしたりする。
さらに言えば、間違った破綻した文章をChatGPTの画像生成器に突っ込む、入力すると、最悪だと画像生成自体ができない、エラーを吐いてしまうことも多いようだ。
Make the beautiful and cute girl look more fantastical and elf-like, and give it even more sparkling color. hair color is Create the image again with a beautiful silver color that looks like a mysterious purple, and make the costume look fantastic and the colors blue and silverish
まあ、そんなこんなで、いい感じのモノができたのである。
みんなも手軽に高品質な挿絵を作れる機能を使って自分の小説をより彩り豊かにしたり執筆の想像力をインスピレーションさせていこう!!、という話でした。