Як конвертувати документ Word у HTML за допомогою C#

Як конвертувати документ Word у HTML за допомогою C#

У цьому короткому посібнику ми дізнаємося, як конвертувати документ Word у HTML за допомогою C#. Це перетворення можна ефективно виконати на будь‑якій операційній системі, такій як macOS, Linux або MS Windows, де налаштовано .NET framework.

Переваги конвертації документів Word у HTML

  1. Веб‑сумісність: - HTML‑файли можна легко відображати у веб‑браузерах.
  2. Збереження форматування: - Більшість форматування з документа Word можна зберегти у HTML‑виводі.
  3. Крос‑платформна функціональність: - HTML‑файли можна відкривати з різних платформ без проблем сумісності.

Web Integration: Інтегрувати функціональність порівняння у веб‑орієнтовані платформи співпраці.

Крок 1: Встановити бібліотеку Aspose.Words

Ресурси.

Install-Package Aspose.Words

Крок 2: Завантажити файл DOCX

Створіть екземпляр класу Document, щоб завантажити Word‑документ, який ви хочете конвертувати.

Document doc = new Document("Input.docx");

Крок 3: Вказати властивості HtmlSaveOptions

Встановіть різні властивості за допомогою класу HtmlSaveOptions для конвертації.

using Aspose.Words.Saving;
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Крок 4: Зберегти результат у форматі HTML

Використайте метод Document.Save, щоб зберегти файл у форматі HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Приклад коду для перетворення DOCX у HTML

Ось повний приклад, який об’єднує всі кроки разом:

using Aspose.Words;
using Aspose.Words.Saving;
// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Висновок

У цьому підручнику ми розглянули, як перетворити документ Word у HTML за допомогою C#. Дотримуючись викладених кроків, ви можете налаштувати параметри конвертації відповідно до ваших вимог, забезпечуючи збереження цілісності вашого HTML, що відповідає оригінальному документу. Для подальшого вивчення розгляньте матеріали щодо перетворення файлів DOCX у інші формати, наприклад TIFF.

 Українська