AI Image Generator はテキストプロンプトを受け取り、FLUX や Stable Diffusion の各種バリアントなどの拡散モデルを使って 1 枚または複数の画像を生成するツールです。モデルを選択し、出力サイズ(128〜8192 ピクセル)を設定し、必要に応じてスタイルや構図を誘導するための参照画像を最大 16 枚アップロードできます。生成された画像は PNG・JPG・WebP 形式でその場でダウンロードできます。
プロンプトの書き方が結果に与える影響
プロンプトが具体的なほど、モデルが安定した生成方向を見つけやすくなります。「猫」と「窓台に座るトラ猫、左から差し込む柔らかな窓の光、背景はぼかし、映画的な色調」では結果が大きく異なります。主体・スタイル・照明・構図の 4 軸を記述すると、ほとんどの視覚的ニーズをカバーできます。
ネガティブプロンプトフィールドでは不要な要素を除外できます: blurry, low quality, watermark, deformed hands。すべてのモデルがネガティブプロンプトに対応しているわけではなく、非対応の場合はこのフィールドが無視されます。
ステップ数と CFG Scale
ステップ数はノイズ除去の反復回数を制御します。20〜30 ステップは高速で方向確認に適しており、40〜50 ステップは最終出力に向けた詳細の追加に使います。50 ステップを超えると効果の向上は限定的になります。
CFG Scale はモデルがプロンプトに従う厳密さを制御します。よく使われる範囲は 7〜12 です。低い値はモデルに創造的な自由度を与えて多様性が増しますが、描写から逸脱することがあります。14 を超える高い値は彩度過多や色調のズレを引き起こしやすくなります。FLUX 系モデルは SD 系とは CFG への感度が異なり、通常 7 を超える必要はありません。
素早い検証フェーズ
- ステップ数 20–25
- CFG Scale 7
- 1 枚、デフォルトサイズ
- 構図とスタイルを確認してから調整
最終出力フェーズ
- ステップ数 35–50
- CFG Scale 7–10(必要に応じて微調整)
- 2〜4 枚生成して選択
- 最終的な出力サイズを使用
参照画像の役割
参照画像をアップロードすると(最大 16 枚)、モデルがそこからスタイル・構図・主体の特徴を抽出して出力を誘導します。参照画像の利用方法はモデルによって異なります。スタイル誘導として扱うもの、主体適応に使うもの、参照画像がなければ動作しないものがあります。参照画像が「必須」と表示されているモデルでは、画像を省略すると生成がブロックされます。
出力サイズの制約
出力は PNG・JPG・WebP 形式で 128〜8192 ピクセルに対応しています。一部のモデルは寸法が 64 の倍数である必要があり、送信時に自動調整されます。極端に横長のバナー形式など非標準的なアスペクト比では、構図が不安定になるモデルがあります。