Hvordan konvertere PDF til Excel (XLS / XLSX / CSV) i .NET
Denne artikkelen viser hvordan du programmatisk konverterer PDF-dokumenter til Microsoft Excel-formater (XLS, XLSX, CSV, og mer) ved hjelp av Aspose.PDF XLS Converter for .NET. Dette gjør det mulig å unlock, analysere og automatisere dataoverføring fra PDFs til spreadsheets for videre behandling, rapportering, eller arkivering.
Real-verdens problem
Eksport av tabeller eller strukturerte data fra PDFs til Excel manuelt er arbeidsintens og feilfri. Automatisering av denne konverteringen er avgjørende for arbeidsflyter i finans, rapportering, analyse og overholdelse der massive PDF-til-spreadsheet-operasjoner er nødvendig.
Oversikt over løsning
Aspose.PDF XLS Converter for .NET lar deg:
- Konverter enkelt eller flere PDF-er til Excel-filer (XLSX, XLS, CSV, ODS, XML)
- Kontroller arbeidsblatt struktur og formatering
- Integrere jevnt med C#/NET-prosjekter for skalerbar automatisering
Prerequisites
- Visual Studio 2019 eller senere
- .NET 6.0 eller senere
- Aspose.PDF for .NET installert via NuGet
PM> Install-Package Aspose.PDF
Step-by-step implementering
Steg 1: Referanse nødvendige navneområder
using Aspose.Pdf.Plugins;
using System.IO;
Trinn 2: Konverter en PDF til XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Bruk av tilfeller og applikasjoner (med kodevariasjoner)
1. ** Eksport til CSV, XLS, ODS eller XML**
Angi ønsket utgangsformat ved hjelp av Format
Eiendommer :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat for alle støttet format.
2. Batch Convert Multiple PDFs til Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. *Minimum antall arbeidsplater
Som standard blir hver PDF-side en ny Excel-arbeidsbok. for å lagre alt innhold i en enkelt arbeidsbok:
options.MinimizeTheNumberOfWorksheets = true;
4. ** Angi en hvit kolonne ved start**
For visse dataimport scenarier vil du kanskje legge til en hvit kolonne som den første kolonnen:
options.InsertBlankColumnAtFirst = true;
Beste praksis og tips
- Forhåndsvisning av utgang for å verifisere tabelloppsett og data integritet, spesielt når du bruker avanserte layoutalternativer.
- For store dokumenter, bruk batchbehandling for å automatisere massekonvertering effektivt.
- Når du konverterer til CSV, sjekk delimitere og koding for downstream kompatibilitet.
- For svært strukturerte eller skannede PDF-er, forhåndsprosessdokumenter for beste resultater.
Komplett eksempler på implementering
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Conclusion
Aspose.PDF XLS Converter for .NET muliggjør rask, robust og fleksibel PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatisering i C# prosjekter. Unlock data fra PDFs, streamline analytics, og integrere spreadsheet arbeidsflyter - alt med en enkel, høy ytelse API. Se den fullstendige API Referanse for mer format og valginformasjon.
Ofte stillede spørsmål
**Q: Hvilke formater kan jeg eksportere til i tillegg til XLSX?**A: Støttet format inkluderer XLSX, XLSM, CSV, ODS og Excel 2003 XML. Format
Eiendom å velge.
**Q: Hvordan kan jeg lagre all PDF-innhold i et enkelt arbeidsblad?**A: sett MinimizeTheNumberOfWorksheets = true
På din PdfToXlsOptions
.
**Q: Hvor kan jeg finne flere eksempler eller få støtte?**A: Se den offisielle Aspose.PDF-dokumentasjonen, API-referansen eller kontaktstøtte for avanserte scenarier.