Kako pretvoriti Word dokument u HTML koristeći C#

Kako pretvoriti Word dokument u HTML koristeći C#

U ovom kratkom tutorialu naučit ćemo kako pretvoriti Word dokument u HTML koristeći C#. Ova konverzija može se učinkovito izvesti na bilo kojem operativnom sustavu poput macOS, Linux ili MS Windows gdje je .NET okvir konfiguriran.

Prednosti pretvaranja Word dokumenata u HTML

  1. Web kompatibilnost: - HTML datoteke se mogu lako prikazati u web preglednicima.
  2. Zadržavanje formatiranja: - Većina formatiranja iz Word dokumenta može se sačuvati u HTML izlazu.
  3. Funkcionalnost na više platformi: - HTML datoteke mogu se pristupiti s različitih platformi bez problema kompatibilnosti.

Web Integration: Integrirajte funkcionalnost usporedbe u web‑bazirane platforme za suradnju.

Korak 1: Instalirajte Aspose.Words biblioteku

Ovaj članak prikazuje kako stvoriti REST API za dodavanje vodenih žigova u Word dokumente koristeći Aspose.Words u ASP.NET Coreu. Uključuje postavljanje, implementaciju i implementaciju za Windows, Linux i macOS.

Install-Package Aspose.Words

Korak 2: Učitaj DOCX datoteku

Instancirajte klasu Document kako biste učitali Word dokument koji želite pretvoriti.

Document doc = new Document("Input.docx");

Korak 3: Odredite svojstva HtmlSaveOptions

Postavite različita svojstva pomoću klase HtmlSaveOptions za konverziju.

using Aspose.Words.Saving;
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Korak 4: Spremite izlaz kao HTML

Koristite metodu Document.Save za spremanje datoteke u HTML formatu.

doc.Save("HtmlSaveOptions.html", saveOptions);

Primjer koda za pretvaranje DOCX u HTML

Evo cjelovitog primjera koji objedinjuje sve korake:

using Aspose.Words;
using Aspose.Words.Saving;
// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Zaključak

U ovom tutorialu istražili smo kako pretvoriti Word dokument u HTML koristeći C#. Slijedeći opisane korake, možete prilagoditi postavke konverzije kako bi zadovoljile vaše zahtjeve, osiguravajući da vaš HTML zadrži integritet izvornog dokumenta. Za daljnje istraživanje, razmotrite materijale o pretvaranju DOCX datoteka u druge formate poput TIFF-a.

 Hrvatski