HTML to Markdown convierte código HTML o archivos .html/.htm (hasta 10 MB) en texto Markdown usando el motor Turndown.js. Pega el fragmento o sube el archivo, ajusta las opciones de formato y copia o descarga el resultado como converted.md. Todo el procesamiento ocurre en el navegador, sin enviar datos a ningún servidor.
Qué se convierte bien y qué necesita ajuste manual
Se convierte correctamente
- Párrafos y títulos H1–H6
- Listas ordenadas y desordenadas, incluidas anidadas
- Bloques de código (
<code>y<pre>) - Enlaces en línea y referencias de imágenes
- Citas en bloque (
<blockquote>)
Puede necesitar ajuste manual
- Tablas con celdas combinadas (colspan/rowspan no admitido)
- Listas muy anidadas (la indentación puede desplazarse)
- Imágenes incrustadas (se convierten a
pero la ruta depende del dominio original) - Estilos en línea dentro de
<div>(todo el CSS se elimina)
Las opciones de formato que más importan
El panel "Opciones de conversión" tiene diez configuraciones. Los valores por defecto funcionan en la mayoría de casos, pero estas tres vale la pena revisar:
- Estilo de títulos:
atx(usa prefijos#) tiene mayor compatibilidad quesetext(solo aplica a H1/H2 con===/---). Usaatxsalvo que tengas una razón específica. - Estilo de bloques de código:
fenced(triple acento grave) admite etiquetas de lenguaje para resaltado de sintaxis;indented(cuatro espacios) es más básico pero siempre válido. - Estilo de enlaces:
inlinedmantiene la URL junto al texto;referencedmueve todas las URLs al final del documento, útil en artículos largos donde las URLs en línea dificultan la lectura.
Qué ocurre con scripts, estilos y elementos HTML5
Los bloques <script>, las declaraciones <style> y los elementos HTML5 sin equivalente en Markdown (<video>, <canvas>, <form>) se eliminan por completo. Solo se conserva la estructura que tiene correspondencia en sintaxis Markdown estándar.
Cómo obtener mejor resultado con HTML desordenado
- Si el HTML viene de un CMS o un editor de correo, elimina los
<div>envolventes y los atributos de clase antes de pegar: no producen salida Markdown pero pueden fragmentar párrafos. - Para páginas web completas, copia solo el cuerpo
<article>o<main>en lugar de todo el código fuente. La navegación, la cabecera y el pie añaden ruido sin equivalente Markdown útil. - Si las imágenes incrustadas deben seguir siendo accesibles, comprueba que sus valores
srcsean URLs absolutas. Las rutas relativas como../images/foto.jpgse conservan tal cual y no resolverán fuera del sitio original.