如何使用 C# 将 Word 文档转换为 HTML

如何使用 C# 将 Word 文档转换为 HTML

在此简短的教程中,我们将学习如何将 Word 文档转换为 HTML 使用 C#. 这种转换可以有效地在任何操作系统,如 macOS、Linux 或 MS Windows 上进行,其中 .NET 框架是配置的。

将Word文档转换为HTML的好处

  • 网页兼容性:- HTML 文件可以在 Web 浏览器上轻松显示。

  • 格式化保留:- 大多数从Word文档的格式化可以在HTML输出中保存。

  • 跨平台功能:- HTML 文件可以从不同的平台访问,没有兼容性问题。

步骤指南将Word文档转换为HTML

步骤1:安装 Aspose.Words 图书馆

使用 NuGet 包管理器安装 Aspose.Words 图书馆,以便轻松转换。

Install-Package Aspose.Words

步骤2:下载DOCX文件

即时加载文档类,以加载您要转换的 Word 文档。

Document doc = new Document("Input.docx");

步骤 3: 指定 HtmlSaveOptions 属性

设置不同的属性,使用 HtmlSaveOptions 类进行转换。

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

步骤4:将输出保存为HTML

使用 Document.Save 方法将文件保存为 HTML 格式。

doc.Save("HtmlSaveOptions.html", saveOptions);

示例代码将DOCX转换为HTML

下面是一个完整的例子,将所有步骤聚集在一起:

// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

结论

在此教程中,我们研究了如何将 Word 文档转换为 HTML 使用 C#. 通过遵循列出的步骤,您可以自定义转换设置以满足您的要求,确保您的 HTML 保持原始文档的完整性。

 中文