CJKテキスト整形

概要

テキストスペーシングツールは、中国語と英語・数字の間に「盤古之白」規約に従ってスペースを自動挿入するツールです。中英混在テキストを入力欄に貼り付けるとリアルタイムで処理され、TXT ファイルをアップロードすれば文書全体を一括処理できます。

スペースが挿入される箇所

中国語文字とラテン文字・数字の境界にスペースが追加されます。

  • 中国語の隣に英字: 你好world你好 world
  • 中国語の隣に数字: 版本3.0版本 3.0
  • 英字の隣に中国語: React组件React 組件
  • 数字の隣に中国語: 100倍100 倍

すでにスペースがある箇所は重複して追加されません。句読点、改行、段落構造はそのまま保持されます。

コードブロックも処理対象になる

このツールは入力テキスト内のすべての文字を処理します。Markdown のコードフェンスやインライン code の中にある中国語コメントや変数名も例外ではなく、スペースが挿入されてコードの見た目が崩れる場合があります。

技術文書でコードと本文が混在している場合は、先にコードブロックを抜き出し、本文部分だけをツールで処理してから結果をマージしてください。

TXT ファイルのアップロード

ファイルをアップロードすると全内容が読み込まれ、処理済みテキストがすぐに表示されます。結果をそのままコピーするか、新しい TXT ファイルとしてダウンロードできます。データベースの export フィールド、スクレイピングした記事、翻訳原稿のまとめ処理など、一括クリーンアップに適しています。