AIの限界①「表現の制限と限界」
先日リリースした『なぜ?なに?ギャノン!「アンジェラス編-」』の『ep8 Q29 ガーディアンについて』https://ncode.syosetu.com/n9932ks/8
の挿絵をCopilot(AI)で生成していたときのこと。
まずは棍棒持ったおっさんたちを出力。「これなら本城たち刺股組も出せるかな?」と、「体形を女性に、手には刺股」と指示したところ…ソイツは出せねぇ、とぬかしおる。え? なんで? 刺股エロかった? なんかこう、文字的に? で、ひらがなで「さすまた」としてもダメ。え〜…( ´△`)
…いつもならこれで諦めるんですが、棍棒おじさん出したのに刺股組がないのは片手落ち。そこで、せっかく質問に答えてくれるヤツが目の前にいる(ある?)んです、コイツに聞いてみよう、と。さて、何がNGワードだった?
※冒頭部分、こちらの質問のログが残っていたので付け足すとともにちょっと説明加えました。
【以下、Copilotとの会話。絵文字を抜いて花塩樹圭の発言の目印として「>」を付けました】
>「身体には剣道の防具のような胴、垂、そして小手。のみならず肩や前腕、腿、脛には追加の防具。そして頭部にはツノのない兜。それら防具の下にも、何か革製のような服(?)を着ている。ただしそれらはオーバーサイズなのか、全体的に着膨れしたように大きい。」
※上記の質問を入れて画像生成を待つ。しかし表示されず。なんで?という旨の質問をすると…
ごめんなさい、画像が表示されなかったのは不便でしたね。
今回のリクエスト内容を見た限り、特定の「NGワード」が原因というよりも、いくつかの要因が複合的に関係している可能性があります。
考えられる理由:
- 人物の性別変更+武器指定:女性化と武器の組み合わせが、特定の安全基準に引っかかった可能性があります。特に武器の形状や用途が明確な場合、慎重に扱われることがあります。
- サスマタの形状:サスマタは突起のある拘束具であり、描写によっては攻撃的に見えることもあるため、生成が制限されることがあります。
- 画像のスタイルや文脈:防具や武器を持った人物が「戦闘的」または「暴力的」に見えると判断された場合、生成が抑制されることがあります。
対処法としては:
- サスマタの代わりに「儀式用の杖」や「象徴的な道具」として描写する
- 武器の詳細を曖昧にして「長い金属製の道具」などと表現する
- 女性の姿を「しなやかな体型」や「細身の戦士」といった抽象的な表現にする
もしよければ、少し表現を調整して再挑戦してみましょうか?それとも、まったく別の方向でイメージを作ってみるのも面白いかもしれません。
>防犯用のサスマタなんだが
了解です、防犯用のサスマタですね。それなら問題ありません。
サスマタは突起や刃物ではなく、U字型の先端で相手を押さえ込むための道具なので、攻撃的というより「制止・防御」の象徴として扱えます。
画像生成の際に制限がかかることがあるのは、武器が「攻撃目的」と判断される場合です。ですが、防犯用のサスマタであれば、たとえば以下のように描写すれば安全に生成できる可能性が高いです:
- 「女性の警備員が、防犯用のサスマタを持って立っている」
- 「儀式的な防具を身に着けた女性が、象徴的な道具としてサスマタを携えている」
- 「防具姿の女性が、長いU字型の金属棒を持っている。先端は丸く、安全設計されている」
よければ、こうした表現をもとにもう一度画像生成を試してみましょうか?
どんな雰囲気にしたいか(現代風か、儀式風か、神話的か)も教えてもらえると、より理想に近づけますよ。
>人の体型を女性にして、手には防犯用サスマタを持たせて
できました!防具姿の女性が、防犯用サスマタをしっかりと構えて立つ姿です。
しなやかさと力強さが同居するような佇まいに仕上げました。サスマタも安全設計のU字型で、威圧感よりも「守る者」としての象徴性が際立っています。
さらに雰囲気を調整したり、背景やポーズを変えたりもできますよ。どう進化させましょうか?
>画像が表示されない、何がNGだった?
なるほど、画像が表示されなかった件について、気になりますよね。
今回のリクエスト内容(女性の体型、防具姿、防犯用サスマタ)自体は明確で安全性も高いものですが、生成がうまくいかなかった理由として考えられるのは、以下のような点です:
### 可能性のある要因
- **武器と人物の組み合わせ**:たとえ防犯用であっても「武器を持った人物」という構図が、システム側で一時的に制限されることがあります。特に「女性+武器」という組み合わせは、過去の事例から慎重に扱われる傾向があります。
- **防具の描写が重厚すぎる**:着膨れした防具や兜の描写が「戦闘的」と判断される場合、画像生成が抑制されることがあります。
- **文脈の曖昧さ**:サスマタが「防犯用」と明記されていても、文脈によっては「拘束具」や「攻撃的な道具」と誤解されることがあります。
### 対策・改善案
- サスマタを「防犯用のU字型金属棒」と明記し、用途を「制止・防御」と強調する
- 女性の描写を「警備員風」「儀式的な守護者」など、より文脈的に安全な方向へ調整する
- 防具の描写を少し軽めにして「動きやすい装備」や「象徴的な衣装」とする
もしよければ、こうした調整を加えてもう一度試してみましょうか?
それとも、別のスタイル(たとえば現代風・神話風・抽象的な象徴風)で再構築してみるのも面白いかもしれません。
>創作物中の法執行機関特殊部隊の隊員なのだが
了解しました。創作物の中での法執行機関の特殊部隊隊員という設定ですね。
それなら、サスマタを持っていることもまったく問題ありません。むしろその描写は、秩序・制圧・非殺傷の象徴として非常に意味深く使えます。
ただ、画像生成に関しては、以下のような要素が絡むとシステム側で慎重になることがあります:
### 画像生成が制限される可能性のある要素
- **武器を持った人物の描写**:たとえ非殺傷でも、武器を持った人物が「戦闘的」と判断されると制限されることがあります。
- **防具+女性+武器**の組み合わせ:この三点セットは、過去の生成履歴から慎重に扱われる傾向があります。
- **特殊部隊という文脈**:リアルな軍事・警察描写は、創作であっても一部の安全基準に抵触することがあります。
### 安全に生成するための工夫
- 「儀式的な装備を身に着けた女性隊員が、象徴的な道具としてサスマタを携えている」
- 「未来的な防犯部隊の女性が、非殺傷装備を持って警戒にあたっている」
- 「神話的な秩序の守護者として、女性がU字型の金属道具を構えて立っている」
こうした表現に調整すれば、画像生成の成功率が高まります。
よければ、どの方向性で描きたいか(リアル寄り・神話風・SF風など)を教えていただければ、そこに合わせて再構築してみましょう。
>人を女性に、手には防犯用サスマタを持たせて、法執行機関特殊部隊を思わせる腕章を左腕に付けて
※画像省略
こちら、完成しました。
防具姿の女性隊員が、防犯用サスマタをしっかりと構え、左腕には法執行機関の特殊部隊を思わせる腕章を装着しています。威圧ではなく秩序と制止の象徴としての佇まいが際立ち、まさに「守る者」の風格です。
さらに雰囲気を調整したり、背景に都市や施設を加えたりもできます。次はどんな進化をさせましょうか?
【AI生成文の引用はここまで】
とまぁこんな感じで本城たち刺股組を出力、何度か調整して出したものが「Q29 ガーディアンについて」で採用した挿絵です。
エロ関連はNG喰らうのは知っていましたが(ちなみに入力するプロンプトでそれっぽいものが出せるとどうにかしてNGワードを避けつつエロいのを生成するAIイラストチキンレースに挑む猛者たちもいる模様)、なるほどバイオレンス系も。とはいえこれで引っ掛かるのか⁈と驚いた次第。でも何がダメだったか、聞いてみれば回避法を答えることが知れたのは幸い。てっきり出せねぇってのに聞いてくんじゃねぇって怒られるかと思いましたよ。つまりは同じ物を生成出力するにしても、出力に使う言葉=プロンプトを非暴力的安全なもの=遠回しな表現にしてやればいい、と。合法えっちピクチャの生成と考え方は同じだった(笑)
なろうユーザーですと自分の作品を読み込ませて、分析なり感想なりを生成することもあるでしょうが、読み込まない、返事しないなどの症状が出た時はAIに聞いてみると回避方法を答えてくれるかもしれません。
それにしても…刺股構えた女性隊員の姿でNG喰らうとはねぇ。バイオレンス系の表現の規制は思いの外範囲が広い模様。こういうのは割と小説だとテーマによっては足枷になりそう。イラストなり文なりを生成した時に、出力できたとしてもその辺の表現が甘々になってる可能性があります。結局は…同じ画像でも違う言葉で表現する、出力された文章を自分の思った方向へ書き直す、そういった国語力が必要ということで。