Jak przekonwertować dokument Word na HTML przy użyciu C#

Jak przekonwertować dokument Word na HTML przy użyciu C#

W tym krótkim samouczku dowiemy się, jak przekonwertować dokument Word na HTML przy użyciu C#. Konwersję można efektywnie wykonać na dowolnym systemie operacyjnym, takim jak macOS, Linux lub MS Windows, gdzie skonfigurowany jest framework .NET.

Korzyści z konwertowania dokumentów Word na HTML

  1. Kompatybilność sieciowa: - Pliki HTML mogą być łatwo wyświetlane w przeglądarkach internetowych.
  2. Zachowanie formatowania: - Większość formatowania z dokumentu Word może być zachowana w wyjściu HTML.
  3. Funkcjonalność wieloplatformowa: - Pliki HTML mogą być otwierane z różnych platform bez problemów z kompatybilnością.

Ten samouczek poprowadzi Cię krok po kroku, jak dodać obrazy do dokumentu Word przy użyciu C#. Skorzystamy z aplikacji wiersza poleceń, aby zademonstrować dodawanie obrazu do dokumentu Word.

Krok 1: Zainstaluj bibliotekę Aspose.Words

Zasoby.

Install-Package Aspose.Words

Krok 2: Załaduj plik DOCX

Utwórz instancję klasy Document, aby załadować dokument Word, który chcesz przekonwertować.

Document doc = new Document("Input.docx");

Krok 3: Określ właściwości HtmlSaveOptions

Ustaw różne właściwości przy użyciu klasy HtmlSaveOptions dla konwersji.

using Aspose.Words.Saving;
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Krok 4: Zapisz wynik jako HTML

Użyj metody Document.Save, aby zapisać plik w formacie HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Przykładowy kod do konwersji DOCX na HTML

Oto kompletny przykład, który łączy wszystkie kroki razem:

using Aspose.Words;
using Aspose.Words.Saving;
// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Podsumowanie

W tym samouczku omówiliśmy, jak przekonwertować dokument Word na HTML przy użyciu C#. Postępując zgodnie z opisanymi krokami, możesz dostosować ustawienia konwersji do swoich wymagań, zapewniając, że Twój HTML zachowuje integralność oryginalnego dokumentu. Aby kontynuować, rozważ zapoznanie się z materiałami dotyczącymi konwersji plików DOCX na inne formaty, takie jak TIFF.

 Polski