Genshin Voice Synthesis convierte texto en audio con la voz de un personaje de Genshin Impact, usando clonación de voz por IA basada en grabaciones de referencia de cada personaje. Escribe el texto, elige el personaje y el idioma, y la herramienta genera un archivo de audio que puedes reproducir y descargar. Cada síntesis se cobra por número de caracteres, con un máximo de 2000 caracteres por petición.
Disponibilidad de idiomas por personaje
Los personajes tienen audio de referencia en algunos o todos los cinco idiomas disponibles: automático, chino, inglés, japonés y coreano. "Automático" elige el idioma disponible para ese personaje. Si un personaje no tiene grabación de referencia en el idioma elegido, el botón de enviar permanece desactivado hasta que cambies a un idioma o personaje compatible.
Frases cortas, mejores resultados
- Una frase o párrafo breve con puntuación completa
- Menos de 1000 caracteres suele sonar más natural
- Un contexto emocional claro ayuda a la interpretación
Narraciones más largas
- Hasta 2000 caracteres por petición
- Divide en párrafos naturales y genera por partes
- La descripción del tono puede guiar el ritmo general
Para qué sirve el campo de descripción del tono
La descripción del tono es opcional, con un máximo de 500 caracteres. Úsalo para indicar instrucciones como "ritmo algo más lento, tono suave" o "fría, grave, ligeramente cansada". Este texto no aparece en el audio generado — solo influye en cómo el modelo interpreta la voz. Si lo dejas vacío, el modelo infiere el tono a partir del propio texto.
Historial y resultados
Tras enviar, quédate en la página — la generación suele tardar entre 20 y 60 segundos. El audio aparece directamente en la página una vez listo, y puedes escucharlo y descargarlo. Los últimos 7 días de síntesis están disponibles en el panel de historial, con el nombre del personaje, el idioma, el número de caracteres y los créditos usados.
Consejos para mejores resultados
- Incluye puntuación completa en el texto — las pausas y la entonación son más precisas cuando el modelo puede leer los límites de las frases
- Evita mezclar varios idiomas en una sola petición (por ejemplo, chino e inglés intercalados); esto puede reducir la fidelidad de la voz
- Para textos muy largos, divídelos en párrafos de diálogo y genera por separado, luego combina los archivos
- Los nombres de personajes y lugares funcionan mejor escritos en el idioma original del personaje