如何使用 C# 将 Word 文档转换为 HTML

如何使用 C# 将 Word 文档转换为 HTML

在这个简短的教程中,我们将学习如何使用 C# 将 Word 文档转换为 HTML。此转换可以在配置了 .NET 框架的任何操作系统上高效执行,如 macOS、Linux 或 MS Windows。

将 Word 文档转换为 HTML 的好处

  1. 网页兼容性
    • HTML 文件可以轻松在网页浏览器中显示。
  2. 格式保留
    • Word 文档中的大部分格式可以在 HTML 输出中保留。
  3. 跨平台功能
    • HTML 文件可以在各种平台上访问而不会出现兼容性问题。

将 Word 文档转换为 HTML 的逐步指南

步骤 1:安装 Aspose.Words 库

使用 NuGet 包管理器安装 Aspose.Words 库以便于转换。

Install-Package Aspose.Words

步骤 2:加载 DOCX 文件

实例化 Document 类以加载要转换的 Word 文档。

Document doc = new Document("Input.docx");

步骤 3:指定 HtmlSaveOptions 属性

使用 HtmlSaveOptions 类设置不同的属性以进行转换。

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

步骤 4:将输出保存为 HTML

使用 Document.Save 方法以 HTML 格式保存文件。

doc.Save("HtmlSaveOptions.html", saveOptions);

将 DOCX 转换为 HTML 的示例代码

以下是一个将所有步骤结合在一起的完整示例:

// 加载输入 Word DOCX 文件
Document doc = new Document("Input.docx");

// 设置 HtmlSaveOptions 类的不同属性
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// 保存输出 HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

结论

在本教程中,我们探讨了如何使用 C# 将 Word 文档转换为 HTML。通过遵循所述步骤,您可以自定义转换设置以满足您的要求,确保您的 HTML 保留原始文档的完整性。要进一步探索,可以参考将 DOCX 文件转换为其他格式(如 TIFF)的材料。

 中文