Як конвертувати документ Word в HTML за допомогою C#

Як конвертувати документ Word в HTML за допомогою C#

У цьому короткому посібнику ми навчимося, як конвертувати документ Word у HTML за допомогою C#. Цю конверсію можна ефективно виконати на будь-якій операційній системі, такій як macOS, Linux або MS Windows, де налаштовано .NET framework.

Переваги конвертації документів Word у HTML

  1. Сумісність з вебом:
    • HTML-файли можна легко відображати в веб-браузерах.
  2. Збереження форматування:
    • Більшість форматування з документа Word можна зберегти у вихідному HTML.
  3. Кросплатформенна функціональність:
    • HTML-файли можна отримати з різних платформ без проблем сумісності.

Покрокова інструкція з конвертації документа Word у HTML

Крок 1: Встановіть бібліотеку Aspose.Words

Встановіть бібліотеку Aspose.Words за допомогою менеджера пакетів NuGet для полегшення конверсії.

Install-Package Aspose.Words

Крок 2: Завантажте файл DOCX

Інстанціюйте клас Document, щоб завантажити документ Word, який ви хочете конвертувати.

Document doc = new Document("Input.docx");

Крок 3: Визначте властивості HtmlSaveOptions

Встановіть різні властивості за допомогою класу HtmlSaveOptions для конверсії.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Крок 4: Збережіть вихідний файл у форматі HTML

Використовуйте метод Document.Save, щоб зберегти файл у форматі HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Приклад коду для конвертації DOCX у HTML

Ось повний приклад, який об’єднує всі кроки:

// Завантажте вхідний файл Word DOCX
Document doc = new Document("Input.docx");

// Встановіть різні властивості класу HtmlSaveOptions
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Збережіть вихідний HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Висновок

У цьому посібнику ми дослідили, як конвертувати документ Word у HTML за допомогою C#. Дотримуючись викладених кроків, ви можете налаштувати параметри конверсії відповідно до ваших вимог, забезпечуючи збереження цілісності вашого HTML. Для подальшого вивчення розгляньте матеріали про конвертацію файлів DOCX в інші формати, такі як TIFF.

 Українська