プロンプトの書き方が結果に与える影響

プロンプトが具体的なほど、モデルが安定した生成方向を見つけやすくなります。「猫」と「窓台に座るトラ猫、左から差し込む柔らかな窓の光、背景はぼかし、映画的な色調」では結果が大きく異なります。主体・スタイル・照明・構図の 4 軸を記述すると、ほとんどの視覚的ニーズをカバーできます。

ネガティブプロンプトフィールドでは不要な要素を除外できます: blurry, low quality, watermark, deformed hands。すべてのモデルがネガティブプロンプトに対応しているわけではなく、非対応の場合はこのフィールドが無視されます。

ステップ数と CFG Scale

ステップ数はノイズ除去の反復回数を制御します。20〜30 ステップは高速で方向確認に適しており、40〜50 ステップは最終出力に向けた詳細の追加に使います。50 ステップを超えると効果の向上は限定的になります。

CFG Scale はモデルがプロンプトに従う厳密さを制御します。よく使われる範囲は 7〜12 です。低い値はモデルに創造的な自由度を与えて多様性が増しますが、描写から逸脱することがあります。14 を超える高い値は彩度過多や色調のズレを引き起こしやすくなります。FLUX 系モデルは SD 系とは CFG への感度が異なり、通常 7 を超える必要はありません。

ステップ数 20–25
CFG Scale 7
1 枚、デフォルトサイズ
構図とスタイルを確認してから調整

ステップ数 35–50
CFG Scale 7–10（必要に応じて微調整）
2〜4 枚生成して選択
最終的な出力サイズを使用

参照画像の役割

参照画像をアップロードすると（最大 16 枚）、モデルがそこからスタイル・構図・主体の特徴を抽出して出力を誘導します。参照画像の利用方法はモデルによって異なります。スタイル誘導として扱うもの、主体適応に使うもの、参照画像がなければ動作しないものがあります。参照画像が「必須」と表示されているモデルでは、画像を省略すると生成がブロックされます。

出力サイズの制約

出力は PNG・JPG・WebP 形式で 128〜8192 ピクセルに対応しています。一部のモデルは寸法が 64 の倍数である必要があり、送信時に自動調整されます。極端に横長のバナー形式など非標準的なアスペクト比では、構図が不安定になるモデルがあります。

AI 画像生成

プロンプトの書き方が結果に与える影響

ステップ数と CFG Scale

素早い検証フェーズ

最終出力フェーズ

参照画像の役割

出力サイズの制約