Cách Chuyển Đổi Tài Liệu Word Sang HTML Sử Dụng C#

Cách Chuyển Đổi Tài Liệu Word Sang HTML Sử Dụng C#

Trong hướng dẫn ngắn này, chúng ta sẽ học cách chuyển đổi tài liệu Word sang HTML bằng C#. Việc chuyển đổi này có thể được thực hiện một cách hiệu quả trên bất kỳ hệ điều hành nào như macOS, Linux hoặc MS Windows nơi mà framework .NET đã được cấu hình.

Lợi ích của việc chuyển đổi tài liệu Word sang HTML

  1. Tương thích với Web:
    • Các tệp HTML có thể dễ dàng hiển thị trên các trình duyệt web.
  2. Giữ nguyên định dạng:
    • Hầu hết các định dạng từ tài liệu Word có thể được bảo tồn trong đầu ra HTML.
  3. Chức năng đa nền tảng:
    • Các tệp HTML có thể được truy cập từ nhiều nền tảng khác nhau mà không gặp vấn đề tương thích.

Hướng dẫn từng bước để chuyển đổi tài liệu Word sang HTML

Bước 1: Cài đặt Thư viện Aspose.Words

Cài đặt thư viện Aspose.Words bằng cách sử dụng trình quản lý gói NuGet để hỗ trợ việc chuyển đổi.

Install-Package Aspose.Words

Bước 2: Tải tệp DOCX

Khởi tạo lớp Document để tải tài liệu Word mà bạn muốn chuyển đổi.

Document doc = new Document("Input.docx");

Bước 3: Chỉ định các thuộc tính HtmlSaveOptions

Đặt các thuộc tính khác nhau bằng cách sử dụng lớp HtmlSaveOptions cho việc chuyển đổi.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Bước 4: Lưu đầu ra dưới dạng HTML

Sử dụng phương thức Document.Save để lưu tệp ở định dạng HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Mã ví dụ để chuyển đổi DOCX sang HTML

Dưới đây là một ví dụ hoàn chỉnh tổng hợp tất cả các bước lại với nhau:

// Tải tệp Word DOCX đầu vào
Document doc = new Document("Input.docx");

// Đặt các thuộc tính khác nhau của lớp HtmlSaveOptions
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Lưu đầu ra HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Kết luận

Trong hướng dẫn này, chúng ta đã khám phá cách chuyển đổi một tài liệu Word sang HTML bằng C#. Bằng cách làm theo các bước đã nêu, bạn có thể tùy chỉnh các cài đặt chuyển đổi để đáp ứng yêu cầu của mình, đảm bảo rằng HTML của bạn giữ nguyên tính toàn vẹn của tài liệu gốc. Để tìm hiểu thêm, hãy xem xét tham khảo các tài liệu về việc chuyển đổi tệp DOCX sang các định dạng khác như TIFF.

 Tiếng Việt