このツールを使うにはログインが必要です
このツールはクレジットを消費する可能性があります。続行するにはログインしてください。

AI オーディオ変換

概要

AI オーディオ変換は既存の楽曲をメロディそのままに別ジャンル・別声・別アレンジへと再構成するツールです。同じ画面で 2 系統のモデルを切り替えられます。MiniMax Music Cover は楽曲全体のスタイル変換に特化、ACE-Step v1.5(Base / Turbo)はテキストから楽曲を生成しつつ、参考音声を渡せばカバーやリミックスのシードとしても扱えます。

ソース音声のルール

MiniMax Music Cover は 6 秒〜6 分のソース音声が必須です。ACE-Step はソース音声をオプションとして受け付け、与えられた場合はリミックスのシードとして扱われ、出力長はソースクリップに追従します(時長スライダーは無視されます)。アップロード前にメタデータから長さを読むため、デコードできないファイルは送信できません。

歌詞・Verse タグ・インストゥルメンタル出力

MiniMax と ACE-Step はどちらもセクションタグ付きの構造化歌詞欄を受け付けます。プロバイダは散文段落から構造を推論しないため、角括弧のタグは必ず付けてください。

[Intro]
[Verse]
Wheels in circles on a painted line
Neon streaks and a borrowed shine
[Chorus]
Glide with me through the afterglow
Where the silver speakers throb real low
[Bridge]
[Outro]

MiniMax のカバー時に元歌詞を保ちたい場合は、骨組みのセクションだけ書いて、ソース歌唱に追従するよう短く指示するのが定石です。

[Intro]
[Verse]
Keep the original lyrics and phrasing from the source vocal.
[Chorus]
Keep the original lyrics and phrasing from the source vocal.

ACE-Step は歌詞欄が空(または構造タグのみ)のときインストゥルメンタルを生成します。よりクリーンな器楽出力には「Advanced」内の Vocal language を「Instrumental / Auto」に設定してください。

ACE-Step の上級パラメータ

ソース音声あり

  • Strength — ソース追従に費やすデノイズステップの割合。0 はソース無視、1 はソース密着。明確な変化と創作余地を両立させたいなら 0.5 から
  • Cover conditioning — 元曲構造の保持度。値が高いほどソースを認識しやすい仕上がりに
  • 時長スライダーは非表示——出力長はソースクリップに追従します

ソース音声なし

  • 時長 で出力長を指定(6〜300 秒、既定 60)
  • Strength と Cover conditioning は無効になり UI 上で操作不可
  • Steps はディテールの細かさを制御。Base は最大 300(既定 100)、Turbo は最大 20(既定 10)
  • CFG Scale はプロンプト追従度を司ります。ネガティブプロンプトを与える場合は必ず 1 より大きい必要があり、サーバ側で 1.5 まで自動補正されます

スタイルプロンプトの書き方

楽曲生成のプロンプトは詩的なキャプションよりも音楽プロデューサーの指示書に近い書き方が向きます。聞きたい要素を列挙してください。

Late-70s funk-pop cover with a bright female lead, tight disco drums, elastic bassline, crisp rhythm guitar, brass stabs, sparkling synth accents, dramatic breakdown, triumphant final chorus.
Lo-fi hip-hop, jazzy electric piano chords, mellow boom-bap drums at 88 BPM, vinyl crackle, late-night focus mood, no vocals.

BPM はプロンプト内と BPM スライダーの両方で指定すると追従しやすくなります。歌詞付きで生成する場合は Vocal language を明示してください。未指定だと ACE-Step は英語として処理します。

コストとクレジット予約

MiniMax Music Cover は入力長に関係なく 1 生成ごとの定額制です。ACE-Step は生成秒数で課金されます。

  • ソース音声なしの場合、クレジット予約は時長スライダーの値で見積もります
  • ソース音声ありの場合、計測された実際のソース長から予約を組むため、4 分のクリップでも時長欄が非表示でも十分なクレジットを確保します
  • 最終決済は各タスクが返す実コストでプロバイダ請求に合わせて精算されます

試聴とダウンロード

生成結果はその場で再生できます。ダウンロードボタンは選択中の形式(MP3 / WAV / FLAC / OGG)に従い、履歴側も生成時の形式を保持しているため、過去の結果を再ダウンロードしても拡張子が静かに変わることはありません。結果横に表示されるシード値(seed)を控えておくと、1 つのパラメータだけ変えて再生成や微調整が可能です。