Hvordan man konverterer Word-dokument til HTML ved hjælp af C#

Hvordan man konverterer Word-dokument til HTML ved hjælp af C#

I denne korte tutorial vil vi lære, hvordan man konverterer et Word-dokument til HTML ved hjælp af C#. Denne konvertering kan udføres effektivt på ethvert operativsystem som macOS, Linux eller MS Windows, hvor .NET-rammen er konfigureret.

Fordele ved at konvertere Word-dokumenter til HTML

  • Web kompatibilitet:- HTML-filer kan nemt vises på webbrowsere.

  • Formatering af Retention:- De fleste formateringer fra Word-dokumentet kan bevares i HTML-udgangen.

  • Funktionalitet på tværs af pladsen:- HTML-filer kan få adgang fra forskellige platforme uden kompatibilitetsproblemer.

Step-by-step guide til konvertering af Word-dokument til HTML

Trin 1: Installere Aspose.Words bibliotek

Installere Aspose.Words-biblioteket ved hjælp af NuGet-pakkeadministratoren for at lette konverteringen.

Install-Package Aspose.Words

Trin 2: Last ned DOCX-filen

Instancere dokumentklassen for at oplade Word-dokumentet, du ønsker at konvertere.

Document doc = new Document("Input.docx");

Trin 3: Angiv HtmlSaveOptions egenskaber

Indstill forskellige egenskaber ved hjælp af HtmlSaveOptions-klassen for konverteringen.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Trin 4: Save udgangen som HTML

Brug Document.Save-metoden til at gemme filen i HTML-format.

doc.Save("HtmlSaveOptions.html", saveOptions);

Eksempel kode til at konvertere DOCX til HTML

Her er et komplet eksempel, der sætter alle trin sammen:

// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Konklusion

I denne tutorial har vi undersøgt, hvordan man konverterer et Word-dokument til HTML ved hjælp af C#. Ved at følge de trin, du kan tilpasse konverteringsindstillingerne til at opfylde dine krav, så din HTML bevarer integriteten af det oprindelige dokument. For yderligere undersøgelse, overveje at henvise til materialer om konvertering af DOCX-filer til andre formater som TIFF.

 Dansk