Cách Đọc Tài Liệu Word trong C# Sử Dụng Aspose.Words

Cách Đọc Tài Liệu Word trong C# Sử Dụng Aspose.Words

Đọc tài liệu Word trong C# có thể rất đơn giản với việc sử dụng thư viện Aspose.Words. Hướng dẫn này cung cấp hướng dẫn chi tiết về cách cấu hình môi trường của bạn, quy trình từng bước để đọc các tệp Word và các ví dụ mã có thể chạy. Bạn sẽ học cách đọc các định dạng khác nhau như DOCX hoặc DOC, và cách truy cập các phần tử khác nhau trong một tài liệu Word.

Lợi ích của việc Đọc Tài liệu Word

  1. Truy cập vào các phần tử tài liệu:
    • Trích xuất và thao tác với các đoạn văn, bảng và các đoạn văn bản.
  2. Tích hợp dễ dàng:
    • Tích hợp liền mạch việc đọc tài liệu Word vào các ứng dụng C# của bạn.
  3. Tính linh hoạt:
    • Xử lý các định dạng Word khác nhau một cách dễ dàng.

Điều kiện tiên quyết: Chuẩn bị cho việc Đọc Tài liệu Word

  1. Đảm bảo bạn đã cài đặt Visual Studio hoặc bất kỳ IDE .NET nào khác.
  2. Cài đặt thư viện Aspose.Words qua trình quản lý gói NuGet.
  3. Lập kế hoạch cấu trúc dự án của bạn để bao gồm các tệp mã cần thiết cho hướng dẫn.

Hướng dẫn Từng bước để Đọc một Tài liệu Word

Bước 1: Cấu hình Môi trường

Trong dự án .NET của bạn, thêm thư viện Aspose.Words bằng cách sử dụng trình quản lý gói NuGet.

Lệnh để chạy: Install-Package Aspose.Words


Bước 2: Tải tệp DOCX đầu vào

Tạo một thể hiện của lớp Document và tải tệp DOCX.

using Aspose.Words;

Document doc = new Document("input.docx");

Bước 3: Lấy tất cả các nút Đoạn văn

Lấy tất cả các nút loại Đoạn văn từ tài liệu.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Bước 4: Lấy tất cả các nút Run

Lấy tất cả các nút loại Run từ tài liệu.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Ví dụ Mã để Đọc Tệp Word trong C#

Dưới đây là mã hoàn chỉnh kết hợp tất cả các bước trên.

// Tải tệp Word nguồn để đọc
Document doc = new Document("input.docx");

// Đọc tất cả các đoạn văn trong tài liệu và hiển thị nội dung của chúng
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Đọc tất cả các Run trong tài liệu và hiển thị kiểu và văn bản
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Kết luận

Trong hướng dẫn này, bạn đã học cách đọc tài liệu Word trong C# bằng cách sử dụng Aspose.Words, bao gồm cấu hình và các ví dụ mã. Kiến thức này cho phép bạn truy cập các phần tử khác nhau trong một tệp Word, giúp dễ dàng xử lý hoặc hiển thị nội dung khi cần thiết. Để khám phá thêm, bạn có thể tham khảo các tài nguyên bổ sung về việc chuyển đổi tài liệu Word sang HTML hoặc các định dạng khác.

 Tiếng Việt