二人以上のキャラクターを組み合わせる場合、一方のキャラクターを背景透過しクリスタのレイヤーを使って合成していた。
ただ、キャラクター間にバーカウンターなどのモノがあった場合、難易度が上がる場合がある。
これをChatGPTで出来ないか検証してみた。
ChatGPTによるキャラクター合成の基本手順
画像を2枚用意した。いずれもオリジナルキャラだよ。

女性A

男性B
用意した二枚の画像を、ChatGPTにアップロードしてチャット欄に指示を入れる。
手順はたったこれだけだ。
複数キャラクターをバーシーンに配置する実践例
「左がA右がB、Aの位置は左カウンター越しにカクテルを差し出している。Bの位置は右で微笑んでAに話しかけている。二人の間にはカウンターがあり、横からのカメラアングル、構図は俯瞰でバーの店内も描いてほしい」
必要なのは、キャラの位置と表現したいアクションだけだ。
具体的に文章を書けばいい!
今回は、一度に二枚作成してくれた。なんだか得した気分!


一枚目は横からのアングルで奥行きを出している、二枚目は俯瞰視点ですね~素晴らしい。
二枚出たのは、構図の指示が二通り出ていたからかもしれないね。
それにしても、今まで苦労してきた違うキャラクターを同時に描く荒業をあっさりやってくれた。
凄すぎる!
こんなに簡単!AIによる画像修正テクニック
カクテルを差し出しているのに、男性の手にはグラスとカウンターにボトル....どんだけ飲むんだよ。
一枚目の画像を使って、余分なグラスとボトルを削除してみよう。
「右のキャラクターの右手のグラスを削除、カウンターのボトルを削除してください」

あっさり消えたね~消すだけではなく腕の位置も変化している。
これは他の部分も同時に修正が入ったということで、AIの進化はものすごく速いのがわかる。
キャラクターの一貫性を保つための検証方法
キャラクターを作成したとき、元画像と少し雰囲気が変わる。
男性の方の雰囲気がより変わったので、少し検証してみる。
元の画像は同じくこれを使う:

場面は同じで少し変化させてみよう。
「グラスに入ったウィスキーを飲んでいる画像を作成する」

ベース画像とは、やはり違うが先に作成した画像とは同じだ。
つまりシステムのベースモデルが違うだけで、作成されたキャラクターの一貫性は保たれている。
では、この画像を使って別の指示を出してみよう。この画像と同じ人物が出れば使えることになるよね~
「飲みほしたグラスをカウンターに置く」と指示をだしたら

完璧じゃないかい!
驚くことにすべて一発出しで生成できている。こんなこと信じられないよね~
ありえない、これまでの苦労はなんだったのか。
いやいや、どこかに穴があるはずだ、重箱の隅をつつきながら色々試してみよう。
プロンプトの書き方のコツ
今回の実験で効果的だったプロンプトの要素をいくつか紹介しよう。
- キャラクターの位置関係を明確に(「左がA右がB」)
- 具体的な動作や表情を指定(「カクテルを差し出している」「微笑んで話しかけている」)
- 環境設定を含める(「二人の間にはカウンターがあり」)
- カメラアングルや構図の指定(「横からのカメラアングル」「俯瞰」)
プロンプトはシンプルでも具体的な指示を入れることで、AIの想像力を適切に導くことができる。特に複数キャラクターの場合は、それぞれの位置関係や相互作用を明確にすることが重要だ。
クリスタとの比較:メリット・デメリット
これまでクリスタで行っていた合成作業と比較してみよう。
ChatGPTのメリット
- レイヤー操作や背景透過など技術的な作業が不要
- 一度の指示で複数の構図を生成できる
- 環境(バーの内装など)も同時に生成される
- 細部の修正が素早く行える
- 連続したポーズの変更が容易
デメリット・注意点
- 元のキャラクターと完全に同一ではない
- 細部の制御は人間の手作業より劣る場合も
- 思わぬ変更が入ることがある(良くも悪くも)
- 構図によっては不自然になる可能性
総合的には、ラフな構想段階や複数のバリエーションを素早く作成したい場合にはChatGPTが優れている。最終的な細部調整や完璧な再現性を求める場合は、従来のツールと組み合わせるのがベストかもしれない。
まとめ
ChatGPTによるキャラクター合成は、これまでの制作ワークフローを大きく変える可能性を秘めているよね。
技術的な制限はあるものの、その簡便さと速さは驚異的だ。
これらの新技術に対して恐れるのではなく、むしろ積極的に取り入れ、自分の表現の幅を広げるツールとして活用していけたら最高じゃない。
次回もいろいろ挑戦してみようと思う。また報告するね!