Cómo convertir un documento de Word a HTML usando C#

Cómo convertir un documento de Word a HTML usando C#

En este breve tutorial, aprenderemos cómo convertir un documento de Word en HTML utilizando C#. Esta conversión se puede realizar de manera eficiente en cualquier sistema operativo como macOS, Linux, o MS Windows donde se configura el marco .NET.

Beneficios de convertir documentos de Word en HTML

  • Compatibilidad web:- Los archivos HTML se pueden ver fácilmente en los navegadores web.

  • Formación de retención:- La mayoría de la formatación del documento Word se puede conservar en la salida HTML.

  • Funcionalidad a través de la plataforma:- Los archivos HTML se pueden acceder desde diferentes plataformas sin problemas de compatibilidad.

Guía paso a paso para convertir el documento Word en HTML

Paso 1: Instalar la biblioteca Aspose.Words

Instalar la biblioteca Aspose.Words utilizando el gerente de paquetes NuGet para facilitar la conversión.

Install-Package Aspose.Words

Paso 2: Cargar el archivo DOCX

Instalar la clase de Documento para cargar el documento de Word que desea convertir.

Document doc = new Document("Input.docx");

Paso 3: especificar las propiedades de HtmlSaveOptions

Configure diferentes propiedades utilizando la clase HtmlSaveOptions para la conversión.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Paso 4: Salva la salida como HTML

Utilice el método Document.Save para salvar el archivo en formato HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

El código de ejemplo para convertir DOCX en HTML

Aquí hay un ejemplo completo que pone todos los pasos juntos:

// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Conclusión

En este tutorial, hemos explorado cómo convertir un documento de Word en HTML utilizando C#. Al seguir los pasos indicados, puede personalizar las configuraciones de conversión para satisfacer sus requisitos, asegurando que su HTML mantiene la integridad del documento original. Para más exploración, considere referirse a materiales sobre la conversión de archivos DOCX a otros formatos como TIFF.

 Español