Com convertir un document Word a HTML amb C#

Com convertir un document Word a HTML amb C#

En aquest breu tutorial, aprendrem com convertir un document Word a HTML amb C#. Aquesta conversió es pot realitzar de manera eficient en qualsevol sistema operatiu com macOS, Linux o MS Windows on el marc .NET està configurat.

Avantatges de convertir documents Word a HTML

  1. Compatibilitat web: - Els fitxers HTML es poden visualitzar fàcilment en navegadors web.
  2. Retenció del format: - La major part del format del document Word es pot conservar a la sortida HTML.
  3. Funcionalitat multiplataforma: - Els fitxers HTML es poden accedir des de diverses plataformes sense problemes de compatibilitat.

Integració web: Integrar la funcionalitat de comparació a plataformes de col·laboració basades en web.

Pas 1: Instal·la la biblioteca Aspose.Words

Problemes i solucions comuns: Solucionant problemes de la vostra automatització.

Install-Package Aspose.Words

Pas 2: Carrega el fitxer DOCX

Instancia la classe Document per carregar el document Word que vols convertir.

Document doc = new Document("Input.docx");

Pas 3: Especifica les propietats de HtmlSaveOptions

Estableix diferents propietats mitjançant la classe HtmlSaveOptions per a la conversió.

using Aspose.Words.Saving;
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Pas 4: Desa la sortida com a HTML

Utilitza el mètode Document.Save per desar el fitxer en format HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Codi d’exemple per convertir DOCX a HTML

Aquí teniu un exemple complet que agrupa tots els passos:

using Aspose.Words;
using Aspose.Words.Saving;
// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Conclusió

En aquest tutorial, hem explorat com convertir un document de Word a HTML utilitzant C#. Seguint els passos descrits, podeu personalitzar la configuració de conversió per satisfer les vostres necessitats, assegurant que el vostre HTML mantingui la integritat del document original. Per a una exploració més profunda, considereu consultar materials sobre la conversió de fitxers DOCX a altres formats com TIFF.

 Català