Jak przekonwertować dokument Word na HTML za pomocą C#

Jak przekonwertować dokument Word na HTML za pomocą C#

W tym krótkim samouczku nauczymy się, jak przekonwertować dokument Word na HTML przy użyciu C#. Ta konwersja może być skutecznie przeprowadzona na każdym systemie operacyjnym, takim jak macOS, Linux lub MS Windows, na którym skonfigurowany jest framework .NET.

Korzyści z konwersji dokumentów Word do HTML

  1. Kompatybilność z siecią:
    • Pliki HTML mogą być łatwo wyświetlane w przeglądarkach internetowych.
  2. Zachowanie formatowania:
    • Większość formatowania z dokumentu Word może być zachowana w wyjściowym pliku HTML.
  3. Funkcjonalność międzyplatformowa:
    • Pliki HTML mogą być dostępne z różnych platform bez problemów z kompatybilnością.

Przewodnik krok po kroku do konwersji dokumentu Word na HTML

Krok 1: Zainstaluj bibliotekę Aspose.Words

Zainstaluj bibliotekę Aspose.Words za pomocą menedżera pakietów NuGet, aby ułatwić konwersję.

Install-Package Aspose.Words

Krok 2: Załaduj plik DOCX

Zainicjuj klasę Document, aby załadować dokument Word, który chcesz przekonwertować.

Document doc = new Document("Input.docx");

Krok 3: Określ właściwości HtmlSaveOptions

Ustaw różne właściwości za pomocą klasy HtmlSaveOptions dla konwersji.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Krok 4: Zapisz wynik jako HTML

Użyj metody Document.Save, aby zapisać plik w formacie HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Przykładowy kod do konwersji DOCX na HTML

Oto kompletny przykład, który łączy wszystkie kroki:

// Załaduj plik Word DOCX
Document doc = new Document("Input.docx");

// Ustaw różne właściwości klasy HtmlSaveOptions
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Zapisz wynikowy HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Podsumowanie

W tym samouczku zbadaliśmy, jak przekonwertować dokument Word na HTML przy użyciu C#. Postępując zgodnie z opisanymi krokami, możesz dostosować ustawienia konwersji do swoich wymagań, zapewniając, że twój HTML zachowa integralność oryginalnego dokumentu. Aby dalej zgłębić temat, rozważ zapoznanie się z materiałami na temat konwersji plików DOCX do innych formatów, takich jak TIFF.

 Polski