Com convertir un document de paraula en HTML amb C#

Com convertir un document de paraula en HTML amb C#

En aquest breu tutorial, aprenem com convertir un document de Word a HTML utilitzant C#. Aquesta conversió es pot realitzar eficientment en qualsevol sistema operatiu com macOS, Linux, o MS Windows on es configura el marc .NET.

Beneficis de convertir documents de Word a HTML

  • Compatibilitat web:- Els arxius HTML es poden visualitzar fàcilment en els navegadors web.

  • Formació de retenci:- La majoria de la formatació del document Word es pot conservar en la sortida HTML.

  • Funcionalitat a través de la plataforma:- Els arxius HTML es poden accedir des de diverses plataformes sense problemes de compatibilitat.

Guia de pas a pas per convertir el document Word en HTML

Pas 1: Instal·lació de la Biblioteca Aspose.Words

Instal·la la biblioteca Aspose.Words utilitzant el gestor de paquets NuGet per facilitar la conversi.

Install-Package Aspose.Words

Pas 2: Carregar el fitxer DOCX

Instal·la la classe Document per carregar el document Word que vol convertir.

Document doc = new Document("Input.docx");

Pas 3: Especificar les propietats d’HtmlSaveOptions

Establir diferents propietats utilitzant la classe HtmlSaveOptions per a la conversi.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Pas 4: Salvar la sortida com a HTML

Utilitzeu el mètode Document.Save per salvar el fitxer en format HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Codi d’exemple per convertir DOCX a HTML

Aquí teniu un exemple complet que posa tots els passos junts:

// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Conclusió

En aquest tutorial, hem explorat com convertir un document Word a HTML utilitzant C#. Seguint els passos esmentats, podeu personalitzar les configuracions de conversió per satisfer les vostres necessitats, assegurant que el vostre HTML manté la integritat del document original. Per a més exploració, considereu referint-se als materials sobre la conversió de fitxers DOCX a altres formats com TIFF.

 Català