วิธีการแปลง PDF ไปยัง Excel (XLS / XLSX / CSV) ใน .NET

วิธีการแปลง PDF ไปยัง Excel (XLS / XLSX / CSV) ใน .NET

บทความนี้แสดงให้เห็นว่าวิธีการแปลงเอกสาร PDF ในรูปแบบ Microsoft Excel (XLS, XLSX, CSV, ฯลฯ) โดยใช้ Aspose.PDF XLS Converter สําหรับ .NET นี้ช่วยให้คุณสามารถล็อคการวิเคราะห์และอัตโนมัติการถ่ายโอนข้อมูลจากไฟล์ PDF ไปยังหน้าแปลนสําหรับการประมวลผลเพิ่มเติมการรายงานหรือเก็บข้อมูล

ปัญหาโลกจริง

Exporting tables or structured data from PDFs to Excel manually is labor-intensive and error-proof. การอัตโนมัติการแปลงนี้เป็นสิ่งสําคัญสําหรับกระแสทํางานในทางการเงินการรายงานการวิเคราะห์และการปฏิบัติตามที่จํานวนมาก PDF-to- spreadsheet การดําเนินงานที่จําเป็น

ความคิดเห็นเกี่ยวกับโซลูชัน

Aspose.PDF XLS Converter for .NET ช่วยให้คุณ:

  • แปลงไฟล์ PDF เดี่ยวหรือหลายไฟล์ไปยังไฟล์ Excel (XLSX, XLS, CSV, ODS, XML)
  • การควบคุมโครงสร้างแผ่นงานและรูปแบบ
  • การบูรณาการได้อย่างราบรื่นกับโครงการ C#/.NET สําหรับการอัตโนมัติแบบสแกน

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า
  • Aspose.PDF สําหรับ .NET ติดตั้งผ่าน NuGet
PM> Install-Package Aspose.PDF

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอนที่ 1: การอ้างอิงพื้นที่ชื่อที่จําเป็น

using Aspose.Pdf.Plugins;
using System.IO;

ขั้นตอน 2: แปลงไฟล์ PDF ไปยัง XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

การใช้กรณีและแอพพลิเคชัน (ด้วยการเปลี่ยนแปลงรหัส)

1. การส่งออกไปยัง CSV, XLS, ODS หรือ XML

ระบุรูปแบบการส่งออกที่ต้องการโดยใช้ Format คุณสมบัติ :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat สําหรับรูปแบบที่ได้รับการสนับสนุนทั้งหมด

2. Batch แปลงหลายไฟล์ PDF ไปยัง Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. ลดจํานวนแผ่นงาน

โดยเริ่มต้นแต่ละหน้า PDF จะกลายเป็นตารางงาน Excel ใหม่ เพื่อบันทึกเนื้อหาทั้งหมดไว้ในแผ่นงานเดียว:

options.MinimizeTheNumberOfWorksheets = true;

4. ใส่คอลัมน์สีขาวเมื่อเริ่มต้น

สําหรับสถานการณ์การนําเข้าข้อมูลบางอย่างคุณอาจต้องการเพิ่มคอลัมน์สีขาวเป็นกลมแรก:

options.InsertBlankColumnAtFirst = true;

การปฏิบัติที่ดีที่สุดและเคล็ดลับ

  • แสดงผลลัพธ์เพื่อตรวจสอบการจัดตั้งตารางและความสมบูรณ์ของข้อมูลโดยเฉพาะอย่างยิ่งเมื่อใช้ตัวเลือกจัดวางขั้นสูง
  • สําหรับเอกสารขนาดใหญ่ใช้การประมวลผลชุดเพื่ออัตโนมัติการแปลงจํานวนมากได้อย่างมีประสิทธิภาพ
  • เมื่อแปลงเป็น CSV, ตรวจสอบ delimiters และ encoding สําหรับ compatibility downstream.
  • สําหรับไฟล์ PDF ที่โครงสร้างสูงหรือสแกนเป็นเอกสารก่อนกระบวนการเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

ตัวอย่างการดําเนินการที่สมบูรณ์

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

ข้อสรุป

Aspose.PDF XLS Converter สําหรับ .NET ช่วยให้การอัตโนมัติ PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) ได้อย่างรวดเร็วและมีความยืดหยุ่นในโครงการ C# ปล็อคข้อมูลจากไฟล์ PDF, การวิเคราะห์เส้นผ่านศูนย์กลางและการบูรณาการไหลของแผ่นงาน - ทั้งหมดด้วย API ที่เรียบง่ายและมีประสิทธิภาพสูง อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบและตัวเลือก

คําถามที่ถามบ่อย

**Q: รูปแบบใดที่ฉันสามารถส่งออกไปนอกเหนือจาก XLSX?**A: รูปแบบที่ได้รับการสนับสนุนรวมถึง XLSX, XLSM, CSV, ODS, และ Excel 2003 XML Format คุณสมบัติที่จะเลือก

**Q: ฉันจะบันทึกเนื้อหา PDF ทั้งหมดในแผ่นงานเดียวได้อย่างไร?**A: ชุด MinimizeTheNumberOfWorksheets = true บน ของคุณ PdfToXlsOptions.

Q: ฉันสามารถหาตัวอย่างเพิ่มเติมหรือรับการสนับสนุนได้อย่างไรA: ดูเอกสาร ASPOSE.PDF อย่างเป็นทางการ การอ้างอิง API หรือการสนับสนุนการติดต่อสําหรับสถานการณ์ขั้นสูง

 แบบไทย