原神ボイス合成

100文字あたり5クレジット

概要

原神ボイス合成は、各キャラクターの参照音声データをもとにAIが音色をクローンし、入力テキストをそのキャラクターらしい音声に変換するツールです。テキストを入力してキャラクターと言語を選択するだけで、再生・ダウンロード可能な音声ファイルが生成されます。料金はテキストの文字数に基づき、1回あたり最大2000文字まで対応しています。

キャラクターごとの言語対応

各キャラクターには自動・中国語・英語・日本語・韓国語の5言語のうち一部または全部の参照音声があります。「自動」を選ぶと、そのキャラクターで利用可能な言語が自動的に選択されます。選択した言語の参照音声が存在しないキャラクターの場合、対応している言語またはキャラクターに切り替えるまで送信ボタンが無効のままになります。

句読点が整った1文または短いパラグラフ
1000文字以内だと抑揚がより自然になりやすい
明確な感情コンテキストがあると表現力が上がる

最大2000文字まで対応
自然なパラグラフ単位で分割して複数回生成するのが安定
話し方の指定でペース全体をコントロールできる

話し方の指定フィールドの役割

話し方の指定は任意項目で最大500文字です。「やや遅いペース、穏やかな口調」や「冷たく、低音で、少し疲れた感じ」といった表現指示を渡せます。このテキストは音声には含まれず、モデルが声の表現方法を解釈する際にのみ使われます。空欄の場合は、モデルがテキスト本文から自動的に口調を判断します。

履歴と結果の確認

送信後はページをそのまま待ちます — 生成は通常20〜60秒かかります。完了すると音声がページ上に表示され、その場で試聴・ダウンロードができます。過去7日間の生成履歴は履歴パネルで確認でき、キャラクター名・言語・文字数・消費クレジットが記録されています。

より良い結果を得るためのポイント

テキストには句読点を適切に入れる — 文の区切りが読めると、間や抑揚がより正確になる
1回の送信に複数の言語を混在させない（例：中国語と英語を交互に使う）と、音色の再現度が下がることがある
非常に長い台詞は対話のパラグラフ単位で分割して個別生成し、後から結合するとよい
キャラクター名や地名はそのキャラクターの原語で書くほうが安定する

原神ボイス合成

キャラクターごとの言語対応

短い台詞は自然に仕上がる

長い台詞・ナレーション

話し方の指定フィールドの役割

履歴と結果の確認

より良い結果を得るためのポイント