Esta herramienta convierte texto japonés — mezcla de kanji, hiragana y katakana — a hiragana, katakana o romaji. El motor de análisis morfológico Kuroshiro + Kuromoji procesa el texto en el servidor y devuelve el resultado según el modo de conversión que hayas seleccionado.
Lo que produce cada modo de conversión
Normal: sustituye directamente cada carácter. 東京に行きます → とうきょうにいきます (objetivo hiragana). Sin espacios, sin kanji originales.
Segmentado: inserta espacios en los límites de palabra. El mismo texto se convierte en とうきょう に いきます, útil para ver dónde termina una palabra y empieza la siguiente.
Okurigana: conserva el kanji pero añade entre paréntesis solo la parte que cambia con la conjugación. 食べます → 食(た)べます. El kanji permanece; solo se anota el sufijo flexivo.
Furigana: anota todos los kanji con su lectura completa entre paréntesis. 東京に行きます → 東京(とうきょう)に行(い)きます. Es el equivalente en texto plano de las anotaciones ruby de los libros de texto.
Qué sistema de romaji elegir
Hepburn (el más habitual)
- El más cercano a la fonética inglesa
ちょっと → chotto,新幹線 → shinkansen- Estándar internacional en libros de texto y topónimos
Nippon / Passport
- Nippon: sigue estrictamente el cuadro de 50 sonidos —
ちょっと → tyotto - Passport: norma actual del gobierno japonés para pasaportes —
大野 → Ohno(noOono) - El estilo Nippon raramente se usa fuera de la lingüística académica
Los modos okurigana y furigana combinados con romaji como objetivo dan resultados limitados — las lecturas entre paréntesis se romanizan pero el kanji original se mantiene como kanji. El hiragana es el objetivo más útil cuando el fin es anotar pronunciación.
Por qué una lectura puede estar equivocada
El motor usa el diccionario Kuromoji para el análisis morfológico. Los errores se concentran en:
- Homógrafos (
今日se leeきょうen conversación peroこんにちen今日は): el contexto suele resolverlo, pero las entradas muy cortas dan poco contexto al motor - Nombres propios — topónimos y nombres de persona tienen con frecuencia lecturas no estándar que el diccionario no recoge
- Neologismos — palabras de aparición reciente pueden no estar en el diccionario
Si una lectura parece incorrecta, cambiar al modo segmentado permite ver los límites de palabra que ha elegido el motor, lo que suele revelar dónde se produjo el análisis erróneo.
Conseguir el mejor resultado según el uso
- Práctica de método de entrada: modo normal → hiragana. Las frases cortas funcionan mejor que párrafos largos.
- Anotación estilo libro de texto: modo furigana → hiragana. Los textos más largos mejoran la precisión en homógrafos porque dan más contexto.
- Lectores sin conocimiento de japonés: modo normal → romaji (Hepburn). El modo segmentado añade espacios que facilitan la lectura.
- Comprobar la lectura de un kanji concreto: pega solo esa palabra, no la frase completa. Menos tokens rodean al kanji y el análisis se concentra en esa unidad.