วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words
การอ่านเอกสาร Word ใน C# สามารถทำได้ง่าย ๆ ด้วยการใช้ไลบรารี Aspose.Words สอนนี้ให้คำแนะนำโดยละเอียดเกี่ยวกับวิธีการตั้งค่าสภาพแวดล้อมของคุณ ขั้นตอนทีละขั้นตอนสำหรับการอ่านไฟล์ Word และตัวอย่างโค้ดที่สามารถรันได้ คุณจะได้เรียนรู้วิธีการอ่านรูปแบบต่าง ๆ เช่น DOCX หรือ DOC และวิธีการเข้าถึงองค์ประกอบต่าง ๆ ภายในเอกสาร Word
ประโยชน์ของการอ่านเอกสาร Word
- การเข้าถึงองค์ประกอบของเอกสาร:
- ดึงและจัดการย่อหน้า ตาราง และข้อความ
- การรวมที่ง่าย:
- รวมการอ่านเอกสาร Word เข้ากับแอปพลิเคชัน C# ของคุณได้อย่างราบรื่น
- ความหลากหลาย:
- จัดการรูปแบบ Word ต่าง ๆ ได้อย่างไม่มีปัญหา
ข้อกำหนดเบื้องต้น: การเตรียมการสำหรับการอ่านเอกสาร Word
- ตรวจสอบให้แน่ใจว่าคุณติดตั้ง Visual Studio หรือ IDE .NET อื่น ๆ
- ติดตั้งไลบรารี Aspose.Words ผ่านตัวจัดการแพ็คเกจ NuGet
- วางแผนโครงสร้างโปรเจกต์ของคุณเพื่อรวมไฟล์โค้ดที่จำเป็นสำหรับบทช่วยสอน
คู่มือทีละขั้นตอนในการอ่านเอกสาร Word
ขั้นตอนที่ 1: ตั้งค่าสภาพแวดล้อม
ในโปรเจกต์ .NET ของคุณ ให้เพิ่มไลบรารี Aspose.Words โดยใช้ตัวจัดการแพ็คเกจ NuGet
คำสั่งที่ต้องรัน:
Install-Package Aspose.Words
ขั้นตอนที่ 2: โหลดไฟล์ DOCX ที่ต้องการ
สร้างอินสแตนซ์ของคลาส Document และโหลดไฟล์ DOCX
using Aspose.Words;
Document doc = new Document("input.docx");
ขั้นตอนที่ 3: ดึงข้อมูลโหนดย่อหน้าทั้งหมด
ดึงข้อมูลโหนดทั้งหมดที่เป็นประเภท Paragraph จากเอกสาร
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
ขั้นตอนที่ 4: ดึงข้อมูลโหนด Run ทั้งหมด
ดึงข้อมูลโหนดประเภท Run จากเอกสาร
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
ตัวอย่างโค้ดในการอ่านไฟล์ Word ใน C#
นี่คือโค้ดทั้งหมดที่รวมขั้นตอนข้างต้นทั้งหมด
// โหลดไฟล์ Word ต้นฉบับที่ต้องการอ่าน
Document doc = new Document("input.docx");
// อ่านย่อหน้าทั้งหมดในเอกสารและแสดงเนื้อหาของพวกเขา
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// อ่าน Run ทั้งหมดในเอกสารและแสดงสไตล์และข้อความ
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
บทสรุป
ในบทช่วยสอนนี้ คุณได้เรียนรู้วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words รวมถึงการตั้งค่าและตัวอย่างโค้ด ความรู้นี้ช่วยให้คุณเข้าถึงองค์ประกอบต่าง ๆ ภายในไฟล์ Word ทำให้การประมวลผลหรือแสดงเนื้อหาเป็นไปได้ง่ายขึ้นตามที่ต้องการ สำหรับการสำรวจเพิ่มเติม คุณอาจอ้างอิงไปยังแหล่งข้อมูลเพิ่มเติมเกี่ยวกับการแปลงเอกสาร Word เป็น HTML หรือรูปแบบอื่น ๆ