画像生成AI プロンプトパーツ集:Copilot(DALL-E3)での使用ガイド

2024/04/15

copilot 画像生成AI

t f B! P L
Copilotで画像生成


この記事では、Copilotでの画像生成の為のプロンプト(パーツ)を紹介しています。

どのように条件を書けばいいのかわからない、思ったように生成されない場合に参考になるかもしれません。

また、良さげなパーツを見つけたら随時更新予定です。

画像生成AIとは

Copilotによる画像生成に関する解説

画像生成AIとは、人工知能(AI)を使用して新しい画像を作成する技術のことを指します。

この技術は、AIが学習したデータセットに基づいて、ユーザーが指定したパラメータや条件に従って画像を生成します。

画像生成AIの一般的な応用例としては、アート作品の生成、ゲームや映画の背景やキャラクターの生成、写真の修復や強化、仮想現実(VR)や拡張現実(AR)の環境生成などがあります。

画像生成AIには様々な技術が使われますが、その中でも特に注目されているのが**生成敵対ネットワーク(GAN)**です。

GANは、生成ネットワークと識別ネットワークの2つの部分から成り立っています。生成ネットワークは新しい画像を生成し、識別ネットワークはその画像が本物(学習データセットに含まれる画像)か偽物(生成ネットワークが生成した画像)かを判断します。

この2つのネットワークが互いに競争しながら学習を進めることで、生成ネットワークは本物に近い高品質な画像を生成する能力を向上させます。

Microsoft CopilotのDALL-E3は、このようなAI画像生成技術を利用しています。

ユーザーがテキストで指示を出すと、それを解釈して関連する画像を生成します。

これにより、ユーザーは自分の思い描いたシーンやオブジェクトを具現化することができます。

ただし、AI画像生成技術は完全ではなく、ユーザーの指示を完璧に理解し、それを完全に満たす画像を生成することは難しい場合があります。

また、生成された画像の品質は、AIの学習データやモデルの設計に大きく依存します。

そのため、期待通りの結果が得られない場合でも、指示を調整したり、AIの能力を理解することで、より良い結果を得ることが可能です。

パーツの使い方と組み立て方


プロンプトサンプル

 

「以下の条件で画像生成」と書いた後に、使いたいものをコピーして貼り付けていくだけです。 

自分で入力する場合はあまり複雑な条件にならないように、簡潔に書きましょう。

いろいろなジャンルのパーツがありますが、例えば「水泳」を含む指示をすれば「プール」が背景として生成されたり、水着になったりします。


パーツはジャンルでまとめること、うまくいかない時は同じ条件で再生成の指示という感じでいいでしょう。


それと、会話のスタイルは個人的には「バランスよく」がおすすめです。

パーツ集


国籍

ただシンプルに「日本人」と指示すると高確率で和服姿になってしまうと思います。

服装などのパーツと組み合わせたりすることで避けることが可能なはずです。

場所

場所の指示をしなくても、「職業」や「服装」、「状況」などの指示によって背景が生成されます。

  • 体育館
  • テニスコート
  • 草原
  • 公園
  • 海中
  • 河原

人数

「1人」「2人」のように指示すると良いと思います。

複数人の細かい設定を指示すると、正しく生成されされにくくなると思います。

服装

色はもちろん生地、素材、構造の指定も可能です。

状況やシーンの指示によって、指示が上書きされることがあります。

普通に指示してもなかなか全身が生成されない場合は、姿勢や状況の指示を工夫して試してみましょう。

  • ノースリーブ
  • ワンピース
  • タンクトップ
  • ジーンズ
  • ショート丈のジーンズ
  • Tシャツ
  • ゴスロリ
  • パフスリーブ
  • フリルブラウス

職業

職業の指示によって、指定した年齢に影響を与えたりすることがあるので要注意。

  • 男性アイドル
  • 女性アイドル
  • 学生
  • 教師
  • バーテンダー
  • ファッションモデル
  • スポーツ選手
  • 医師
  • 看護師
  • 研究者

髪型

  • ショートヘア
  • ショートボブ
  • ツインテール
  • ショートツインテール
  • ポニーテール
  • セミロング
  • ロングヘアー
  • モヒカン

顔、体型

  • 丸顔
  • 標準体型
  • 標準体型よりも少しだけ痩せている
  • 標準体型よりも少しだけふくよか
  • 筋肉質
  • ぽっちゃり体型

状況

いろいろな要素に影響を与える可能性あり(服装など)。

プール、海水浴の指示で高確率で水着になると思います。

  • 運動後
  • フルマラソン後
  • 海水浴
  • ピラティス中
  • ジャンプしている
  • 大ジャンプしている

姿勢、ポーズ

座っている姿勢は場合によってはブロックされ、画像生成されません。

姿勢やポーズは組み合わせも可能。

  • ソファーに座っている
  • 床に座っている
  • 階段に座っている
  • ピースをしている
  • ピースサイン
  • 腕を肩よりも高く上げている
  • ハグをしている
  • 女の子ハグをしている

その他

  • 格子状の穴が全体的にあいている
  • ハニカム構造の穴が全体的にあいている
  • 仲良し
  • 壁と床が一面鏡張り

NGワードや、適切に生成されない指示など

NGワードはそれなりに厳しく設定されていると思われます。

NGワードを工夫で避けられても、生成過程で「何を生成しているのか」で引っかかる感じですかね。

  • copilotのNGワード
  • 画像生成AI(DALL-E3)でのNGワード
  • 生成過程or生成後に引っかかる要素
  • フィルタはこの3つのような感じがします。

    ですので、copilotで引っかかっても画像が生成されることがあります。

    NGワード例

    • 色気
    • セクシー
    • ブレストファイヤー
    • ホットパンツ等「パンツ」を含む服装

    サイズを物に例えると基本的に正しく生成されません。

    抱き枕サイズの生きたエビを掲げている

    抱き枕サイズの生きたエビ

     

    QooQ