HTML を Markdown に変換

概要

HTML to Markdown は、HTML コードまたは .html/.htm ファイル(最大 10 MB)を Turndown.js エンジンで Markdown テキストに変換するツールです。コードを貼り付けるかファイルをアップロードし、書式オプションを調整して、結果を converted.md としてコピーまたはダウンロードできます。変換はすべてブラウザ内で完結し、サーバーへの送信はありません。

変換品質の目安

確実に変換できる内容

  • 段落および H1–H6 見出し
  • 順序付き・順序なしリスト(ネスト含む)
  • コードブロック(<code><pre>
  • インラインリンクと画像参照
  • ブロック引用(<blockquote>

手動調整が必要になりやすい内容

  • セル結合を含む表(colspan/rowspan 非対応)
  • 深くネストされたリスト(インデントがずれる場合あり)
  • 埋め込み画像(![alt](src) に変換されるが、パスは元のドメインに依存)
  • <div> 内のインラインスタイル(CSS はすべて除去)

変換オプションで特に重要な設定

「変換オプション」パネルには 10 項目の設定があります。デフォルトのままで問題ない場合がほとんどですが、以下の 3 つは確認する価値があります。

  • 見出しスタイルatx# プレフィックス使用)は setext(H1/H2 のみ ===/--- の下線使用)より互換性が高いため、特別な理由がなければ atx を選択してください。
  • コードブロックスタイルfenced(バッククォート3つ)は言語タグを付けてシンタックスハイライトに対応できます。indented(4スペース)はシンプルですが常に有効です。
  • リンクスタイルinlined はリンクテキストの直後に URL を記述します。referenced はすべての URL をドキュメント末尾の参照リストにまとめるため、URL が多い長い記事の可読性が上がります。

スクリプト・スタイル・HTML5 要素の扱い

<script> ブロック、<style> 宣言、Markdown に対応するものがない HTML5 要素(<video><canvas><form> など)は完全に除去されます。標準 Markdown 構文に対応する構造のみが残ります。ファイルアップロードとペーストのどちらでも同じ動作です。

乱雑な HTML からより良い出力を得るために

  • CMS やメールエディターの HTML の場合、貼り付け前に外側の <div> ラッパーとクラス属性を除去すると、段落が分断されるノイズを減らせます。
  • 完全な Web ページの場合、ページのソース全体ではなく <article><main> 本文だけをコピーしてください。ナビゲーションやヘッダー・フッターは Markdown に変換できず、出力に無駄なコンテンツが混入します。
  • 埋め込み画像を変換後も使えるようにしたい場合は、src の値が絶対 URL であることを確認してください。../images/photo.jpg のような相対パスはそのまま保持され、元のサイト外では解決できません。