Hvordan konvertere PDF til Excel (XLS / XLSX / CSV) i .NET
Denne artikkelen viser hvordan å programmatisk konvertere PDF dokumenter i Microsoft Excel-format (XLS, XLSX, CSV, og mer) ved hjelp av Aspose.PDF XLS Converter for .NET. Dette gjør at du kan låse opp, analysere og automatisere dataoverføring fra PDFs til spreadsheets for videre behandling, rapportering eller arkivering.
Real-verdens problem
Eksport av tabeller eller strukturerte data fra PDFs til Excel manuelt er arbeidsintens og feilfri. Automatisering av denne konverteringen er avgjørende for arbeidsflyter i finans, rapportering, analyse og overholdelse der massive PDF-til-spreadsheet-operasjoner er nødvendig.
Oversikt over løsning
Aspose.PDF XLS Converter for .NET lar deg:
- Konverter enkelt eller flere PDF-er til Excel-filer (XLSX, XLS, CSV, ODS, XML)
- Kontroller arbeidsblatt struktur og formatering
- Integrere jevnt med C#/NET-prosjekter for skalerbar automatisering
Prerequisites
- Visual Studio 2019 eller senere
- .NET 6.0 eller senere
- Aspose.PDF for .NET installert via NuGet
PM> Install-Package Aspose.PDFStep-by-step implementering
Steg 1: Referanse nødvendige navneområder
using Aspose.Pdf.Plugins;
using System.IO;Trinn 2: Konverter en PDF til XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);Bruk av tilfeller og applikasjoner (med kodevariasjoner)
1. Eksport til CSV, XLS, ODS eller XML
Angi ønsket utgangsformat ved hjelp av Format Eiendommer:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled ExcelSee PdfToXlsOptions.ExcelFormat for alle støttet format.
2. Batch Convert Multiple PDFs til Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}3. Minimum antall arbeidsplater
Som standard blir hver PDF-side en ny Excel-arbeidsbok. for å lagre alt innhold i en enkelt arbeidsbok:
options.MinimizeTheNumberOfWorksheets = true;4. Angi en hvit kolonne ved start
For visse dataimport scenarier vil du kanskje legge til en hvit kolonne som den første kolonnen:
options.InsertBlankColumnAtFirst = true;Beste praksis og tips
- Forhåndsvisning av utgang for å verifisere tabelloppsett og data integritet, spesielt når du bruker avanserte layoutalternativer.
- For store dokumenter, bruk batchbehandling for å automatisere massekonvertering effektivt.
- Når du konverterer til CSV, sjekk delimitere og koding for downstream kompatibilitet.
- For svært strukturerte eller skannede PDF-er, forhåndsprosessdokumenter for beste resultater.
Komplett eksempler på implementering
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}Conclusion
Aspose.PDF XLS Converter for .NET muliggjør rask, robust og fleksibel PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatisering i C# prosjekter. Unlock data fra PDFs, streamline analytics, og integrere spreadsheet arbeidsflyter - alt med en enkel, høy ytelse API. Se den fullstendige API Referanse for mer format og valginformasjon.
Ofte stillede spørsmål
**Q: Hvilke formater kan jeg eksportere til i tillegg til XLSX?**A: Støttet format inkluderer XLSX, XLSM, CSV, ODS og Excel 2003 XML Format Eiendom å velge.
**Q: Hvordan kan jeg lagre all PDF-innhold i et enkelt arbeidsblad?**A: sett MinimizeTheNumberOfWorksheets = true På din PdfToXlsOptions.
**Q: Hvor kan jeg finne flere eksempler eller få støtte?**A: Se den offisielle Aspose.PDF-dokumentasjonen, API-referansen eller kontaktstøtte for avanserte scenarier.