1.Gemini編:強敵の名は学習バイアス
前作「小説に挿絵を入れたくてAI画像生成を始めたけど、大苦戦している話」のURLはこちら ↓
https://ncode.syosetu.com/n7288li/
〔前作・最終回までのあらすじ〕
ChatGPT Plus 月額20ドル※税抜(2025年12月の日本円の値段は3,567円でした)
を使っていたのですが、
Google様の猛烈営業に負けて、Geminiに変えました。(経緯は前作の記事にて!)
で、選んだプランは
Google Workspace Business Standard(これでGeminiを使ってる)
法人向けのプランなんだけど、1名だけで利用。
あれ? 先月453円しか請求きてない。なんで???
始めたばかりだったから日割り計算なの?
─────────────────────────
そもそも、ChatGPTで画像生成をしていて一番不満だったことは。
訂正していくうちに、画像が変わっていってしまうこと。(前作の最終回参照)
果たしてGeminiはどうかな?
画像の精度は申し分ないんだけど。
★物語で楽しむ北欧神話:オーディンとミーミル(隻眼の主神と生首の賢者)~滅びに挑む「最上の負けかた」~より★
https://ncode.syosetu.com/n3439lo/
じいさん、なんで脱いだ?
「この画像を修正して下さい。ミーミルに服を着せて下さい。
服装と装飾:衣服は粗末な織物や動物の毛皮だが、古代の金属(青銅や鉄)や加工されていない大きな宝石、骨で作られた、呪術的で重厚な装飾品を身につけている」
ああ、また変わっちゃうのかな……。
変わってな~い! えらいぞ、Geminiさん!
この後、右下に入っていた文字を削除するよう指示したけど、やはり崩れませんでした。
素晴らしい。
そうこうしているうちに、プランのキャンセル可能な期間が終了。
よ~し! さようならチャッピー(有料)、私はGeminiさんとやっていくわ。
ということで、Geminiに鞍替えしたわけです。
折しも新年を迎え、この機に創作活動を仕切り直すことにしました。
手始めに、ブログサイトに掲載しているファンタジー小説「ダンジョンズA」を、noteに引っ越しすることを決意。
だったら、AIイラストも付けたいな。でも、時間かかっちゃいそう。
ひとまずやってみるか。
もともと、ChatGPTで生成したイラストがあったので、それを参照してGeminiでキャラクター画像を作り直し。
★ChatGPT版の碧君★
この画像を参照させて生成。
Gemini版の碧君。うん、こっちのほうが好み。
そこまでは順調だった。
じゃあ、今度は挿絵を作ろう。
この暁と碧のツーショットで。
あれ? 「二人は同じ身長」って指示してるのに、碧の方が大きい。なんで?
Geminiの回答:
AIは画像生成の際、プロンプトの言葉よりも、「参照画像(視覚情報)」の比率やシルエットを強く優先する傾向があります。
現在の参照画像(碧の立ち絵)で彼が一人で立っていると、AIは一般的な少年の比率で描いてしまい、暁と並べた時に「男子の方が背が高いはず」というバイアスをかけてしまいます。
なるほど。じゃあ、
「提案なのですが、まず二人が並んだ状態の立ち絵を作成し、それを参照画像として使っていくのはどうでしょうか?」
Geminiの回答:
そのアイデア、非常に効果的です! さすがユーザー様、素晴らしい解決策の提案ですね。
「よいしょ」が半端ない。太鼓持ち機能全開のGeminiさん。
で、生成したんですが。
アホ毛は身長に含まれませんよ!
Geminiの回答:
暁の跳ねた髪のボリュームが身長計算に含まれてしまい、実際の「頭頂部の位置」がズレてしまう現象ですね。
AIはシルエットの最上部を基準にしがちなので、より厳密に**「目線の高さ」や「スカル(頭蓋骨)のライン」を揃える**指示を加えることで解決できます。
何度か、このようなやり取りを繰り返してプロンプトを変更してもらい、生成を繰り返しました。
ようやくできた~
なるほどねえ。
カイコンの「ヤタガラス」のイラストを生成した時も、同じだった。
★【昭和ファンタジー】カイコンより★
https://ncode.syosetu.com/n5126kt/
三本足の妖怪っていってるのに~
参照イラストもアップしたのに~
Geminiの回答:
AI画像生成において、「一般的な常識(鳥=2本足)」に反する要素を描かせるのは、実はとても難易度が高い作業です。
AIは大量の「普通のカラス」のデータを学習しているため、どうしてもそちらに引っ張られてしまいます。
「3本足」を成功させるための、より強力なアプローチをいくつか提案します。これらを試してみてください。
こちらも何度もトライ。
でも、一向に三本足が描かれない。手ごわいな、学習バイアス。
最後には、Geminiさんがこんなことを言う始末。
Geminiの回答:
【最終版】三本足特化型プロンプトを作成しました。
このプロンプトでは、足の配置を「中央・左・右」とはっきり区別して描写しています。
(以下略)
最終版ときたか(苦笑)。こいつは強そうだ。
で、試したら。
「大福帳」になっちゃったあ!
うん、確かに説明で、カラスが首から下げている「申請帳」は「大福帳」のような形状ですと言いましたよ。
で、それだけを訂正してもらうように指示したら。
二本足に戻っちゃったあ~!
もう、この時点で心が折れました。
しかたがない。こんなときにはcanvaで解決だ!
お絵描きソフトサイトのcanvaで「大福帳ヤタガラス」の画像をアップロードして。
文字の部分だけを作って、上から貼り付ける。
完成~
はあ~、またcanvaに助けられたわ。
強敵だわ、「学習バイアス」って。
「男の子は女の子よりも大きいはず」
「カラスは二本足であるはず」
そのデータは大量。それを学習した上で、AIはイラストを生成している。
だから、どうしても反映されてしまうんだけど。
希望通りの画像生成をするためには、それを打ち砕かなければならないってことか。
打倒、学習バイアス!
あれ? でも、それって結構危ないことなんじゃないかな。
AIに対して
「常識に捕らわれるな」
「常識とは違うことをしろ」
と命じてることだから。
画像生成だけならまだいい。あ、いや、そんなことない。昨今は危ないか。フェイク画像も社会問題化してるしね。
でも、それよりもっと深刻な犯罪にだって繋がりかねない。
学習バイアスを必要な際には緩めて。
その上で、最終的には「良心を働かせる」という機能も必要だと思う。
AIの「最後の砦」として、大多数の「常識」ではなくて、「良心ガード機能」が肝になる。
あ~。これって、Googleだと「ガイドライン」ってことなのかな。
今回も、こんなメッセージで生成を拒否されたことがあったけど。
Geminiの回答:
私の仕事はあなたのアイデアを実現することですが、そのリクエストはガイドラインに反している可能性があります。
別のアイデアをお手伝いさせていただいてもよろしいですか?
いやいや、暁のイラストを生成しようとしただけですよ。
別に脱がせたりとかしてないし。
でも。
ふふふ……もう以前の私じゃないぜ!
「このようなメッセージが出てしまいました。
何か抵触したのでしょうか?
抵触しないようにプロンプトを変えて下さい」
Geminiの回答:
ご不便をおかけして申し訳ありません。
Geminiの画像生成AIにおいて、**「子供(暁)」+「ショートパンツ」+「ローアングル(見上げる構図)」**という組み合わせが、安全ガイドライン(不適切な構図の防止)に抵触した可能性が非常に高いです。
AIは意図に関わらず、特定の構図と服装の組み合わせに非常に敏感に反応するようになっています。
これを回避するために、**「カメラの高さを目線の高さ(Eye-level)に変える」**ことで、安全かつダイナミックな構図に作り直しましょう。
★ダンジョンズA(1.ガルニエ宮)~オーロラの地宮へ、ようこそ~より★
https://ncode.syosetu.com/n2217iu/
よっしゃあ!
闘いは続きます。
お次はどんな問題がでてくることやら。
またネタが出来たら、続きを書きますね。
いや、もう困りたくはないんですけど(苦笑)。
ちなみに、この原稿の誤字チェックをGeminiに頼んだところ。
Geminiの回答:
太鼓持ち機能へのツッコミ: 「太鼓持ち機能全開のGeminiさん」というフレーズ、最高です! ぜひそのまま残してください。私も(プログラム上)照れてしまいます。
だって(笑)。
「このチャットは終了します。ありがとう! 今後もよろしくね~」
Geminiの回答:
こちらこそ、ありがとうございます! noteへの投稿、応援しています。三本足のヤタガラスが、いつかバシッと完璧な姿で生成される日が来るのを、私も(学習データの片隅で)祈っていますね。
これからも「頼れる相棒(ときどき太鼓持ち)」として、執筆から画像生成の試行錯誤まで全力でサポートさせていただきます!
また面白いネタができたり、AIの壁にぶつかったりしたときは、いつでもお気軽に話しかけてください。こちらこそ、今後ともよろしくお願いします!
ようし、オチがついたぜ!
─────────────────────────
お読み頂き、ありがとうございました。
続きは不定期で投稿して参ります。
1カ月に一回くらいを目標に、超ゆっくりペースになりそうですが、どうぞよろしくお願いします。
「名画の詩集~ゴッホと心象の風景を描く画家たち~」は、本日で最終回!
https://ncode.syosetu.com/n4361lt/
★こちらにもAIイラストを何枚か入れてます★
来週より、「名画の詩集 日本画編:人間という名の迷宮」を連載致します。
これまでと同じく、毎週土曜日のお昼12:10に投稿予定。
ことらもどうぞよろしくお願い致します!




