วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words

วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words

การอ่านเอกสาร Word ใน C# สามารถทำได้ง่าย ๆ ด้วยการใช้ไลบรารี Aspose.Words สอนนี้ให้คำแนะนำโดยละเอียดเกี่ยวกับวิธีการตั้งค่าสภาพแวดล้อมของคุณ ขั้นตอนทีละขั้นตอนสำหรับการอ่านไฟล์ Word และตัวอย่างโค้ดที่สามารถรันได้ คุณจะได้เรียนรู้วิธีการอ่านรูปแบบต่าง ๆ เช่น DOCX หรือ DOC และวิธีการเข้าถึงองค์ประกอบต่าง ๆ ภายในเอกสาร Word

ประโยชน์ของการอ่านเอกสาร Word

  1. การเข้าถึงองค์ประกอบของเอกสาร:
    • ดึงและจัดการย่อหน้า ตาราง และข้อความ
  2. การรวมที่ง่าย:
    • รวมการอ่านเอกสาร Word เข้ากับแอปพลิเคชัน C# ของคุณได้อย่างราบรื่น
  3. ความหลากหลาย:
    • จัดการรูปแบบ Word ต่าง ๆ ได้อย่างไม่มีปัญหา

ข้อกำหนดเบื้องต้น: การเตรียมการสำหรับการอ่านเอกสาร Word

  1. ตรวจสอบให้แน่ใจว่าคุณติดตั้ง Visual Studio หรือ IDE .NET อื่น ๆ
  2. ติดตั้งไลบรารี Aspose.Words ผ่านตัวจัดการแพ็คเกจ NuGet
  3. วางแผนโครงสร้างโปรเจกต์ของคุณเพื่อรวมไฟล์โค้ดที่จำเป็นสำหรับบทช่วยสอน

คู่มือทีละขั้นตอนในการอ่านเอกสาร Word

ขั้นตอนที่ 1: ตั้งค่าสภาพแวดล้อม

ในโปรเจกต์ .NET ของคุณ ให้เพิ่มไลบรารี Aspose.Words โดยใช้ตัวจัดการแพ็คเกจ NuGet

คำสั่งที่ต้องรัน: Install-Package Aspose.Words


ขั้นตอนที่ 2: โหลดไฟล์ DOCX ที่ต้องการ

สร้างอินสแตนซ์ของคลาส Document และโหลดไฟล์ DOCX

using Aspose.Words;

Document doc = new Document("input.docx");

ขั้นตอนที่ 3: ดึงข้อมูลโหนดย่อหน้าทั้งหมด

ดึงข้อมูลโหนดทั้งหมดที่เป็นประเภท Paragraph จากเอกสาร

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

ขั้นตอนที่ 4: ดึงข้อมูลโหนด Run ทั้งหมด

ดึงข้อมูลโหนดประเภท Run จากเอกสาร

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

ตัวอย่างโค้ดในการอ่านไฟล์ Word ใน C#

นี่คือโค้ดทั้งหมดที่รวมขั้นตอนข้างต้นทั้งหมด

// โหลดไฟล์ Word ต้นฉบับที่ต้องการอ่าน
Document doc = new Document("input.docx");

// อ่านย่อหน้าทั้งหมดในเอกสารและแสดงเนื้อหาของพวกเขา
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// อ่าน Run ทั้งหมดในเอกสารและแสดงสไตล์และข้อความ
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

บทสรุป

ในบทช่วยสอนนี้ คุณได้เรียนรู้วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words รวมถึงการตั้งค่าและตัวอย่างโค้ด ความรู้นี้ช่วยให้คุณเข้าถึงองค์ประกอบต่าง ๆ ภายในไฟล์ Word ทำให้การประมวลผลหรือแสดงเนื้อหาเป็นไปได้ง่ายขึ้นตามที่ต้องการ สำหรับการสำรวจเพิ่มเติม คุณอาจอ้างอิงไปยังแหล่งข้อมูลเพิ่มเติมเกี่ยวกับการแปลงเอกสาร Word เป็น HTML หรือรูปแบบอื่น ๆ

 แบบไทย