Cara Mengkonversi PDF ke Excel (XLS / XLS / CSV) dalam .NET

Cara Mengkonversi PDF ke Excel (XLS / XLS / CSV) dalam .NET

Artikel ini menunjukkan cara untuk secara programmatik mengkonversi dokumen PDF ke format Microsoft Excel (XLS, XLSX, CSV, dan lain-lain) menggunakan Aspose.PDF XLS Converter untuk .NET. Ini memungkinkan Anda untuk membuka kunci, menganalisis dan otomatis memindahkan data dari pdf ke spreadsheets untuk pemrosesan lebih lanjut, laporan, atau arkib.

Masalah dunia nyata

Mengekspor tabel atau data terstruktur dari PDF ke Excel secara manual adalah kerja-intensif dan error-prone.Mengautomatikkan konversi ini sangat penting untuk aliran kerja dalam keuangan, laporan, analisis, dan pematuhan di mana operasi bulk PDF-to-spreadheet diperlukan.

Penyelesaian Overview

Aspose.PDF XLS Converter untuk .NET memungkinkan Anda:

  • Konversi PDF tunggal atau berbilang ke file Excel (XLSX, XLS, CSV, ODS, XML)
  • Mengontrol struktur lembar kerja dan format
  • Mengintegrasikan dengan lancar dengan proyek C#/NET untuk otomatisasi skala

Persyaratan

  • Visual Studio 2019 atau lebih baru
  • .NET 6.0 atau lebih baru
  • Aspose.PDF untuk .NET yang diinstal melalui NuGet
PM> Install-Package Aspose.PDF

Implementasi langkah demi langkah

Langkah 1: Referensi Ruang Nama yang Diperlukan

using Aspose.Pdf.Plugins;
using System.IO;

Langkah 2: Konversi PDF ke XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Penggunaan Kasus & Aplikasi (dengan Variasi Kode)

1. Ekspor ke CSV, XLS, ODS, atau XML

Menentukan format output yang diinginkan dengan menggunakan Format Kekayaan :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat Untuk semua format yang didukung.

2. Batch Convert Multiple PDFs to Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Mengurangi jumlah lembar kerja

Secara default, setiap halaman PDF menjadi lembar kerja Excel baru.Untuk menyimpan semua konten dalam satu lembaran kerja:

options.MinimizeTheNumberOfWorksheets = true;

4. Masukkan kolom putih pada permulaan

Untuk skenario impor data tertentu, Anda mungkin ingin menambahkan lajur putih sebagai kolom pertama:

options.InsertBlankColumnAtFirst = true;

Praktik dan Tips Terbaik

  • Preview output untuk memverifikasi tata letak tabel dan integritas data, terutama ketika menggunakan opsi tataletak lanjutan.
  • Untuk dokumen besar, gunakan pemrosesan batch untuk mengautomatikkan konversi bulk secara efisien.
  • Ketika berkonversi ke CSV, verify delimiters dan encoding untuk kompatibilitas downstream.
  • Untuk PDF yang sangat terstruktur atau dipindai, dokumen pra-proses untuk hasil terbaik.

Contoh implementasi lengkap

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Kesimpulan

Aspose.PDF XLS Converter untuk .NET memungkinkan otomatisasi PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) yang cepat, kuat dan fleksibel dalam proyek C#. Menghapus data dari PDF, analisis lancar, dan mengintegrasikan aliran kerja spreadsheet - semuanya dengan API yang sederhana, berprestasi tinggi.

Pertanyaan yang sering ditanya

**Q: Format apa yang bisa saya ekspor ke selain XLSX?**A: Format yang didukung termasuk XLSX, XLSM, CSV, ODS, dan Excel 2003 XML. Format Properti yang harus dipilih.

**Q: Bagaimana saya dapat menyimpan semua konten PDF ke dalam satu lembar kerja?**A : Set MinimizeTheNumberOfWorksheets = true Pada Anda PdfToXlsOptions.

**Q: Di mana saya dapat menemukan lebih banyak contoh atau mendapatkan dukungan?**A: Lihat dokumentasi resmi Aspose.PDF, referensi API, atau dukungan kontak untuk skenario lanjutan.

 Indonesia