วิธีแปลงเอกสาร Word เป็น HTML ด้วย C#

วิธีแปลงเอกสาร Word เป็น HTML ด้วย C#

ในบทแนะนำสั้นนี้ เราจะเรียนรู้วิธีแปลงเอกสาร Word เป็น HTML ด้วย C#. การแปลงนี้สามารถทำได้อย่างมีประสิทธิภาพบนระบบปฏิบัติการใดก็ได้ เช่น macOS, Linux หรือ MS Windows ที่มีการกำหนดค่า .NET framework.

ประโยชน์ของการแปลงเอกสาร Word เป็น HTML

  1. ความเข้ากันได้กับเว็บ: - ไฟล์ HTML สามารถแสดงผลได้อย่างง่ายดายบนเว็บเบราว์เซอร์.
  2. การคงรูปแบบ: - ส่วนใหญ่ของการจัดรูปแบบจากเอกสาร Word สามารถคงไว้ในผลลัพธ์ HTML.
  3. ฟังก์ชันการทำงานข้ามแพลตฟอร์ม: - ไฟล์ HTML สามารถเข้าถึงได้จากหลายแพลตฟอร์มโดยไม่มีปัญหาความเข้ากันได้.

คู่มือขั้นตอนการแปลงเอกสาร Word เป็น HTML

การประกอบเอกสารหมายถึงการผสานเทมเพลตหรือไฟล์ Word หลายไฟล์เข้าด้วยกันแบบไดนามิกเป็นเอกสารที่สอดคล้องกัน เทคนิคนี้มีประโยชน์สำหรับการสร้างรายงาน, ข้อเสนอ, หรือเอกสารที่ครอบคลุมทั้งหมด ด้วย Aspose.Words สำหรับ .NET คุณสามารถทำกระบวนการนี้โดยอัตโนมัติผ่านโปรแกรมได้

Resources → ทรัพยากร.

Install-Package Aspose.Words

ขั้นตอนที่ 2: โหลดไฟล์ DOCX

สร้างอินสแตนซ์ของคลาส Document เพื่อโหลดเอกสาร Word ที่คุณต้องการแปลง.

Document doc = new Document("Input.docx");

ขั้นตอนที่ 3: ระบุคุณสมบัติของ HtmlSaveOptions

ตั้งค่าคุณสมบัติต่าง ๆ โดยใช้คลาส HtmlSaveOptions สำหรับการแปลง.

using Aspose.Words.Saving;
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

ขั้นตอนที่ 4: บันทึกผลลัพธ์เป็น HTML

ใช้เมธอด Document.Save เพื่อบันทึกไฟล์ในรูปแบบ HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

ตัวอย่างโค้ดเพื่อแปลง DOCX เป็น HTML

นี่คือตัวอย่างเต็มที่รวมขั้นตอนทั้งหมดเข้าด้วยกัน:

using Aspose.Words;
using Aspose.Words.Saving;
// Load input Word DOCX file
Document doc = new Document("Input.docx");

// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

สรุป

ในบทแนะนำนี้ เราได้สำรวจวิธีการแปลงเอกสาร Word เป็น HTML ด้วย C# โดยการทำตามขั้นตอนที่อธิบายไว้ คุณสามารถปรับแต่งการตั้งค่าการแปลงให้ตรงกับความต้องการของคุณ เพื่อให้ HTML ของคุณคงความสมบูรณ์ของเอกสารต้นฉบับไว้ได้ สำหรับการสำรวจต่อไป ควรดูเอกสารเกี่ยวกับการแปลงไฟล์ DOCX ไปเป็นรูปแบบอื่น ๆ เช่น TIFF.

 แบบไทย