Bagaimana untuk menukar PDF ke Excel (XLS / XLS / CSV) dalam .NET
Artikel ini menunjukkan bagaimana untuk secara programmatik menukar dokumen PDF ke dalam format Microsoft Excel (XLS, XLSX, CSV, dan lain-lain) menggunakan Aspose.PDF XLS Converter untuk .NET. Ini membolehkan anda untuk membuka kunci, menganalisis dan automatik pemindahan data daripada PDF kepada skrip untuk pemprosesan lanjut, laporan, atau arkib.
Masalah dunia sebenar
Mengeksport jadual atau data terstruktur dari PDF ke Excel secara manual adalah kerja-kerja yang intensif dan berisiko.Mengautomatikkan penukaran ini adalah penting untuk aliran kerja dalam kewangan, laporan, analisis, dan pematuhan di mana operasi bulk PDF-to-spreadheet diperlukan.
Gambaran keseluruhan penyelesaian
Aspose.PDF XLS Converter untuk .NET membolehkan anda:
- Menukar satu atau beberapa PDF ke fail Excel (XLSX, XLS, CSV, ODS, XML)
- Mengawal struktur lembaran kerja dan pemformatan
- Mengintegrasikan dengan lancar dengan projek-projek C#/NET untuk automasi skala
Prerequisites
- Visual Studio 2019 atau seterusnya
- .NET 6.0 atau lebih baru
- Aspose.PDF untuk .NET dipasang melalui NuGet
PM> Install-Package Aspose.PDF
Pelaksanaan langkah demi langkah
Langkah 1: Merujuk kepada ruang nama yang diperlukan
using Aspose.Pdf.Plugins;
using System.IO;
Langkah 2: Menukar PDF kepada XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Penggunaan Kasus & Aplikasi (dengan Variasi Kod)
1. ** Eksport ke CSV, XLS, ODS, atau XML**
Menentukan format output yang dikehendaki menggunakan Format
dan hartanah :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat untuk semua format yang disokong.
2. Batch Convert Multiple PDFs ke Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. *Mengurangkan bilangan lembaran kerja
Secara lalai, setiap halaman PDF menjadi lembaran kerja Excel yang baru. untuk menyimpan semua kandungan dalam satu lembar kerja:
options.MinimizeTheNumberOfWorksheets = true;
4. Masukkan lajur putih pada permulaan
Untuk senario pengimportan data tertentu, anda mungkin ingin menambah lajur putih sebagai lapisan pertama:
options.InsertBlankColumnAtFirst = true;
Amalan dan Tips Terbaik
- Prospek output untuk mengesahkan tataletak jadual dan integriti data, terutamanya apabila menggunakan opsyen layout canggih.
- Untuk dokumen besar, gunakan pemprosesan batch untuk mengautomatikkan penukaran bulk dengan cekap.
- Apabila menukar kepada CSV, semak delimiters dan kod untuk kompatibiliti downstream.
- Untuk PDF yang sangat berstruktur atau dipindai, dokumen pra-proses untuk hasil terbaik.
Contoh Pelaksanaan Lengkap
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Conclusion
Aspose.PDF XLS Converter untuk .NET membolehkan automatik PDF-to-Excel yang cepat, kukuh dan fleksibel (XLS / XLSX / CSV / XML / ODS) dalam projek-projek C#. Unlock data daripada PDF, analisis lancar, dan mengintegrasikan aliran kerja spreadsheet - semua dengan API yang mudah, berprestasi tinggi.
Soalan-soalan yang kerap ditanya
**Q: format apa yang boleh saya eksport ke selain XLSX?**A: Format yang disokong termasuk XLSX, XLSM, CSV, ODS, dan Excel 2003 XML. Format
hartanah untuk dipilih.
**Q: Bagaimana saya boleh menyimpan semua kandungan PDF dalam satu lembaran kerja?**A : Set MinimizeTheNumberOfWorksheets = true
kepada anda PdfToXlsOptions
.
**Q: Di mana saya boleh mencari lebih banyak contoh atau mendapatkan sokongan?**A: Lihat dokumen rasmi Aspose.PDF, rujukan API, atau sokongan kenalan untuk senario lanjutan.