วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words
การอ่านเอกสาร Word ใน C# สามารถใช้งานได้ง่ายโดยใช้ห้องสมุด Aspose.Words การสอนนี้ให้คําแนะนํารายละเอียดเกี่ยวกับวิธีการกําหนดสภาพแวดล้อมของคุณขั้นตอนขั้นตอนสําหรับการอ่านไฟล์ Word และตัวอย่างรหัสที่สามารถทํางานได้ คุณจะเรียนรู้วิธีการอ่านรูปแบบต่างๆเช่น DOCX หรือ DOC และวิธีการเข้าถึงองค์ประกอบต่างๆภายในเอกสาร Word
ประโยชน์ของการอ่านเอกสารคํา
เข้าถึงองค์ประกอบเอกสาร:- extract และ manipulate paragraphs, tables, และ run ของข้อความ.
การบูรณาการง่าย:- รวมการอ่านเอกสาร Word ได้อย่างง่ายดายในแอพ C# ของคุณ
ความหลากหลาย:- การจัดการรูปแบบคําที่แตกต่างกันอย่างหนัก
ข้อกําหนด: การเตรียมความพร้อมสําหรับการอ่านเอกสาร Word
- ตรวจสอบให้แน่ใจว่าคุณมี Visual Studio หรือ IDE .NET อื่น ๆ ที่ติดตั้ง
- ติดตั้งห้องสมุด Aspose.Words via NuGet ผู้จัดการแพคเกจ
- การวางแผนโครงสร้างโครงการของคุณเพื่อรวมไฟล์รหัสที่จําเป็นสําหรับการสอน
คู่มือขั้นตอนเพื่ออ่านเอกสาร Word
ขั้นตอนที่ 1: การตั้งค่าสภาพแวดล้อม
ในโครงการ .NET ของคุณเพิ่มห้องสมุด Aspose.Words โดยใช้ผู้จัดการแพคเกจ NuGet
คําสั่งในการทํางาน:Install-Package Aspose.Words
ขั้นตอน 2: ดาวน์โหลดไฟล์ Input DOCX
สร้างตัวอย่างของชั้นเอกสารและโหลดไฟล์ DOCX
using Aspose.Words;
Document doc = new Document("input.docx");
ขั้นตอนที่ 3: รับจุดทั้งหมด
ลบทุกช่องประเภท paragraph จากเอกสาร
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
ขั้นตอนที่ 4: Get All Run Nodes
ลบรหัสแบบ Run ทั้งหมดจากเอกสาร
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
ตัวอย่างรหัสเพื่ออ่านไฟล์ Word ใน C#
นี่คือรหัสสมบูรณ์รวมทั้งขั้นตอนข้างต้น
// Load the source Word file to be read
Document doc = new Document("input.docx");
// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
ข้อสรุป
ในบทเรียนนี้คุณได้เรียนรู้วิธีการอ่านเอกสาร Word ใน C# โดยใช้ Aspose.Words รวมถึงการกําหนดค่าและตัวอย่างรหัส ความรู้นี้ช่วยให้คุณสามารถเข้าถึงองค์ประกอบต่างๆภายในไฟล์ Word ได้ง่ายต่อการประมวลผลหรือแสดงเนื้อหาตามที่จําเป็น สําหรับการสํารวจเพิ่มเติมคุณสามารถอ้างถึงทรัพยากรเพิ่มเติมเกี่ยวกับการแปลงเอกสาร Word ใน HTML หรือรูปแบบอื่น ๆ