Cara Mengkonversi PDF ke Excel (XLS / XLS / CSV) dalam .NET
Artikel ini menunjukkan cara untuk secara programmatik mengkonversi dokumen PDF ke format Microsoft Excel (XLS, XLSX, CSV, dan lain-lain) menggunakan Aspose.PDF XLS Converter untuk .NET. Ini memungkinkan Anda untuk membuka kunci, menganalisis dan otomatis memindahkan data dari pdf ke spreadsheets untuk pemrosesan lebih lanjut, laporan, atau arkib.
Masalah dunia nyata
Mengekspor tabel atau data terstruktur dari PDF ke Excel secara manual adalah kerja-intensif dan error-prone.Mengautomatikkan konversi ini sangat penting untuk aliran kerja dalam keuangan, laporan, analisis, dan pematuhan di mana operasi bulk PDF-to-spreadheet diperlukan.
Penyelesaian Overview
Aspose.PDF XLS Converter untuk .NET memungkinkan Anda:
- Konversi PDF tunggal atau berbilang ke file Excel (XLSX, XLS, CSV, ODS, XML)
- Mengontrol struktur lembar kerja dan format
- Mengintegrasikan dengan lancar dengan proyek C#/NET untuk otomatisasi skala
Persyaratan
- Visual Studio 2019 atau lebih baru
- .NET 6.0 atau lebih baru
- Aspose.PDF untuk .NET yang diinstal melalui NuGet
PM> Install-Package Aspose.PDF
Implementasi langkah demi langkah
Langkah 1: Referensi Ruang Nama yang Diperlukan
using Aspose.Pdf.Plugins;
using System.IO;
Langkah 2: Konversi PDF ke XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Penggunaan Kasus & Aplikasi (dengan Variasi Kode)
1. Ekspor ke CSV, XLS, ODS, atau XML
Menentukan format output yang diinginkan dengan menggunakan Format
Kekayaan :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat Untuk semua format yang didukung.
2. Batch Convert Multiple PDFs to Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Mengurangi jumlah lembar kerja
Secara default, setiap halaman PDF menjadi lembar kerja Excel baru.Untuk menyimpan semua konten dalam satu lembaran kerja:
options.MinimizeTheNumberOfWorksheets = true;
4. Masukkan kolom putih pada permulaan
Untuk skenario impor data tertentu, Anda mungkin ingin menambahkan lajur putih sebagai kolom pertama:
options.InsertBlankColumnAtFirst = true;
Praktik dan Tips Terbaik
- Preview output untuk memverifikasi tata letak tabel dan integritas data, terutama ketika menggunakan opsi tataletak lanjutan.
- Untuk dokumen besar, gunakan pemrosesan batch untuk mengautomatikkan konversi bulk secara efisien.
- Ketika berkonversi ke CSV, verify delimiters dan encoding untuk kompatibilitas downstream.
- Untuk PDF yang sangat terstruktur atau dipindai, dokumen pra-proses untuk hasil terbaik.
Contoh implementasi lengkap
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Kesimpulan
Aspose.PDF XLS Converter untuk .NET memungkinkan otomatisasi PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) yang cepat, kuat dan fleksibel dalam proyek C#. Menghapus data dari PDF, analisis lancar, dan mengintegrasikan aliran kerja spreadsheet - semuanya dengan API yang sederhana, berprestasi tinggi.
Pertanyaan yang sering ditanya
**Q: Format apa yang bisa saya ekspor ke selain XLSX?**A: Format yang didukung termasuk XLSX, XLSM, CSV, ODS, dan Excel 2003 XML. Format
Properti yang harus dipilih.
**Q: Bagaimana saya dapat menyimpan semua konten PDF ke dalam satu lembar kerja?**A : Set MinimizeTheNumberOfWorksheets = true
Pada Anda PdfToXlsOptions
.
**Q: Di mana saya dapat menemukan lebih banyak contoh atau mendapatkan dukungan?**A: Lihat dokumentasi resmi Aspose.PDF, referensi API, atau dukungan kontak untuk skenario lanjutan.