「AIで画像を作ってみたけど、なんか違う…」
AI画像を始めた頃、多くの人がまずぶつかる壁がこれです。キャラのポーズがぎこちなく、背景とのバランスもしっくりこない。プロンプトをいろいろ工夫しても、なかなか理想の形にならない…。
「もっと自然に動いてほしい」「こういう構図にしたい」って、頭の中にはちゃんとあるのに、それをうまく伝えられないもどかしさ。まるで、自分のイメージを他人に説明してるのに伝わらない感覚です。
でも、あるとき気づいたんです。伝え方を変えれば、AIはちゃんと応えてくれるってことに。
この記事では、私が実際に試して「これは効いた!」と感じた3つの方法をご紹介します。
- 図で伝える「棒人間(補助素材)」
- 言葉を整える「ChatGPT」
- 空気感まで見せる「ラフ構図」
どれも、特別なスキルはいりません。
私のように、絵が描けなくても大丈夫。
イメージどおりの画像を手に入れるヒント、ここにあります。
なぜAIに意図が伝わらないのか?
AI画像って、ちょっとした違和感が命取りになりますよね。
- 「足が変な方向向いてる…」
- 「この角度、ほんとは俯瞰にしたかったのに…」
- 「キャラの感情が伝わってこない…」
そんな経験をした方も多いはず。何枚作っても、どこか違和感が残る。
原因は、単純です。プロンプトだけでは、イメージの細部まで正確に伝えるのが難しいから。
言葉って、どうしても曖昧なんです。だからこそ、もうひと工夫が必要なんです。
解決策①:視覚で補う|棒人間でポーズを示す
AIにポーズや動きを伝えるのが難しいと感じたとき、最も効果的なのが視覚的に見せることです。ここでは、誰でも描ける棒人間を使って、動きや重心、方向を補助的に伝える方法を紹介します。
棒人間の利点と役割

「絵が描けない人こそ、棒人間で伝えよう」
右足を前に、左手を挙げて…なんて言葉より、1本の線で描いたほうが早いんです。
棒人間って、シンプルだけどすごく便利。
- どっちに体重かけてるか
- 手足の向き
- 全体のバランス
全部、パッと見てわかるから。
実際に描いてみた体験とおすすめツール
ここでは、CLIP STUDIOを使ってます。しかしクリスタがなくても普通のペイントソフトで描けます。
丸と線だけでも、ChatGPTがちゃんと読み取って、プロンプトにしてくれるんです。
ちなみにStykzっていう無料ツールも試したけど、英語だし操作が独特でちょっと使いづらかった。そのため、最終的には手描きに落ち着きました。
プロンプト補助としての位置づけ
ただし、ここで大事なのは「棒人間はあくまでプロンプトの補助素材」という立場。
ポーズの動きや方向、雰囲気を視覚的に整理する手段として活用します。
棒人間は自分で書いても、無料素材を使ってもいい
棒人間は自分のイメージ通りに描けるなら、それが一番です。ですが、そもそもポーズのイメージが思いつかない場合や、絵を描くのが苦手な方にとっては、素材を活用するのもひとつの手です。
私はFreepikの有料会員なので、そこの棒人間素材を商用利用として活用していますし、市販の「キャラポーズの描き方」などの参考書に付属する素材データも重宝しています。
ただし、無料素材を使用する際は利用規約(商用利用可かどうか)を必ず確認しましょう。
AI画像作成に使っている基本素材について
本記事内で紹介している画像作成の多くは、以下の基本素材を組み合わせて制作しています:
- キャラの一枚絵(立ち絵)
- 三面図(正面・側面・背面)
- 表情セット(喜怒哀楽や驚きなどのバリエーション)
これらをベースにしておくことで、ポーズ差分の生成やイメージtoイメージの変換時にもキャラの整合性が保たれやすく、完成度の高い画像が得られます。
「まずは素材を整える」。これが、AI画像生成を成功させるための土台ともいえます。

解決策②:ChatGPTに伝えて整理してもらう|プロンプトは一緒に考えよう
棒人間などの視覚補助だけでは伝えきれない細かい意図や背景があります。そこで活躍するのがChatGPTへの指示。日本語で状況を説明するだけで、自然なプロンプトに整理してくれます。
ChatGPTは何をしてくれる?

棒人間が完成したら、次に必要なのは「そのポーズがどういう状況なのか」を伝えることです。
たとえば、「ジャンプ中」「逃げている」「挨拶している」など、ポーズの意味や背景の意図をChatGPTに説明することで、プロンプトの精度が上がります。
日本語でもOK!ChatGPTに伝えるコツ
ChatGPTは、日本語でもしっかり対応してくれますし、説明した内容を整理されたプロンプト形式に変換してくれます。
視覚情報(棒人間)だけでは曖昧になりがちな部分を、言葉で補完する役割がChatGPT。
プロンプトづくりの相談相手として、とても心強い存在です。
解決策③:ラフ構図で「空気感」を伝える
ポーズや動きだけでなく、キャラの配置、カメラアングル、視線の方向といった空気感を伝えるのに役立つのがラフ構図。ここでは、構図全体をざっくり描いて、AIに伝える方法も紹介します。
ラフ構図とは?言葉で伝えにくいものを絵に
「視線はこっちに」「背景に窓があって」「ちょっとあおりで見下ろす感じで」
…これ、文章にするの難しくないですか?
だったら描いちゃいましょう。ざっくりでOK。
実際にやってみた!ラフ構図→プロンプト変換の流れ
以下は、実際にCLIP STUDIOで描いたラフ構図の一例です。今回はキャラの位置、セリフ、背景との関係、ABキャラの区別、などを手描きでざっくり示しました。

このラフをもとにChatGPTで構図の意図やキャラのやり取りを説明し、画像生成に反映させました。
フェンスの位置、ユニフォームのディテール、キャラの関係性までもが自然に再現されたことで、完成イメージと大きなギャップがなくなりました。
しかし、セリフが逆だし文字化け、ユニフォームのマークが違うなどまだ課題はあります。

ラフ構図は「ここに立ってて、こう話してる」といった場面の空気まで伝えるのに役立ちます。 「言葉だけでは伝わりにくい部分」を、こうしたラフで補うことで、AIとのやりとりがぐっと楽になります。
最近では、ラフ構図を描いてChatGPTに渡し、プロンプトに整理してもらう方法が効果的だと感じています。しかし棒人間と比較すると手間がかかります。
背景とキャラの位置、視線の方向、空気感──これ、見えるようにするだけでAIの理解力が全然違います。
img2img系のAIなら、ラフ画をそのまま下絵にする方法もあります。

棒人間+ChatGPTが伝える力を倍増する
方法 | 出力結果 | 精度 |
---|---|---|
プロンプトのみ | 手は振ってるけど止まって見える | × |
棒人間+ChatGPT | 動きが自然、躍動感あり | ◎ |
ラフ構図+絵に補足+ChatGPT | 背景・感情・構図までバッチリ | ◎◎◎ |
時短で考えるとやはり、棒人間+ChatGPTが一番でしょう。背景、感情、構図はあとからChatGPTを使って変更可能なので。
まとめ:伝え方を変えれば、AIは変わる
AI画像が「なんか違う」と感じていたあなたへ。
プロンプトだけで頑張る必要はありません。
- 棒人間=ポーズの整理と補助素材
- ChatGPT=意図を言葉で補完する相棒
- ラフ構図=構図・空気感を視覚的に伝える方法
この3つを組み合わせれば、あなたの想像は創造に変わります。
絵が描けなくても、AIに伝える方法はあります。
今日からあなたも、AI画像生成の演出家になりましょう。
コメント