วิธีการแปลง PDF ไปยัง Excel (XLS / XLSX / CSV) ใน .NET
บทความนี้แสดงให้เห็นว่าวิธีการแปลงเอกสาร PDF ในรูปแบบ Microsoft Excel (XLS, XLSX, CSV, ฯลฯ) โดยใช้ Aspose.PDF XLS Converter สําหรับ .NET นี้ช่วยให้คุณสามารถล็อคการวิเคราะห์และอัตโนมัติการถ่ายโอนข้อมูลจากไฟล์ PDF ไปยังหน้าแปลนสําหรับการประมวลผลเพิ่มเติมการรายงานหรือเก็บข้อมูล
ปัญหาโลกจริง
Exporting tables or structured data from PDFs to Excel manually is labor-intensive and error-proof. การอัตโนมัติการแปลงนี้เป็นสิ่งสําคัญสําหรับกระแสทํางานในทางการเงินการรายงานการวิเคราะห์และการปฏิบัติตามที่จํานวนมาก PDF-to- spreadsheet การดําเนินงานที่จําเป็น
ความคิดเห็นเกี่ยวกับโซลูชัน
Aspose.PDF XLS Converter for .NET ช่วยให้คุณ:
- แปลงไฟล์ PDF เดี่ยวหรือหลายไฟล์ไปยังไฟล์ Excel (XLSX, XLS, CSV, ODS, XML)
- การควบคุมโครงสร้างแผ่นงานและรูปแบบ
- การบูรณาการได้อย่างราบรื่นกับโครงการ C#/.NET สําหรับการอัตโนมัติแบบสแกน
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า
- Aspose.PDF สําหรับ .NET ติดตั้งผ่าน NuGet
PM> Install-Package Aspose.PDF
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอนที่ 1: การอ้างอิงพื้นที่ชื่อที่จําเป็น
using Aspose.Pdf.Plugins;
using System.IO;
ขั้นตอน 2: แปลงไฟล์ PDF ไปยัง XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
การใช้กรณีและแอพพลิเคชัน (ด้วยการเปลี่ยนแปลงรหัส)
1. การส่งออกไปยัง CSV, XLS, ODS หรือ XML
ระบุรูปแบบการส่งออกที่ต้องการโดยใช้ Format
คุณสมบัติ :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat สําหรับรูปแบบที่ได้รับการสนับสนุนทั้งหมด
2. Batch แปลงหลายไฟล์ PDF ไปยัง Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. ลดจํานวนแผ่นงาน
โดยเริ่มต้นแต่ละหน้า PDF จะกลายเป็นตารางงาน Excel ใหม่ เพื่อบันทึกเนื้อหาทั้งหมดไว้ในแผ่นงานเดียว:
options.MinimizeTheNumberOfWorksheets = true;
4. ใส่คอลัมน์สีขาวเมื่อเริ่มต้น
สําหรับสถานการณ์การนําเข้าข้อมูลบางอย่างคุณอาจต้องการเพิ่มคอลัมน์สีขาวเป็นกลมแรก:
options.InsertBlankColumnAtFirst = true;
การปฏิบัติที่ดีที่สุดและเคล็ดลับ
- แสดงผลลัพธ์เพื่อตรวจสอบการจัดตั้งตารางและความสมบูรณ์ของข้อมูลโดยเฉพาะอย่างยิ่งเมื่อใช้ตัวเลือกจัดวางขั้นสูง
- สําหรับเอกสารขนาดใหญ่ใช้การประมวลผลชุดเพื่ออัตโนมัติการแปลงจํานวนมากได้อย่างมีประสิทธิภาพ
- เมื่อแปลงเป็น CSV, ตรวจสอบ delimiters และ encoding สําหรับ compatibility downstream.
- สําหรับไฟล์ PDF ที่โครงสร้างสูงหรือสแกนเป็นเอกสารก่อนกระบวนการเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
ตัวอย่างการดําเนินการที่สมบูรณ์
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
ข้อสรุป
Aspose.PDF XLS Converter สําหรับ .NET ช่วยให้การอัตโนมัติ PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) ได้อย่างรวดเร็วและมีความยืดหยุ่นในโครงการ C# ปล็อคข้อมูลจากไฟล์ PDF, การวิเคราะห์เส้นผ่านศูนย์กลางและการบูรณาการไหลของแผ่นงาน - ทั้งหมดด้วย API ที่เรียบง่ายและมีประสิทธิภาพสูง อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบและตัวเลือก
คําถามที่ถามบ่อย
**Q: รูปแบบใดที่ฉันสามารถส่งออกไปนอกเหนือจาก XLSX?**A: รูปแบบที่ได้รับการสนับสนุนรวมถึง XLSX, XLSM, CSV, ODS, และ Excel 2003 XML Format
คุณสมบัติที่จะเลือก
**Q: ฉันจะบันทึกเนื้อหา PDF ทั้งหมดในแผ่นงานเดียวได้อย่างไร?**A: ชุด MinimizeTheNumberOfWorksheets = true
บน ของคุณ PdfToXlsOptions
.
Q: ฉันสามารถหาตัวอย่างเพิ่มเติมหรือรับการสนับสนุนได้อย่างไรA: ดูเอกสาร ASPOSE.PDF อย่างเป็นทางการ การอ้างอิง API หรือการสนับสนุนการติดต่อสําหรับสถานการณ์ขั้นสูง