Hvordan til at konvertere PDF til Excel (XLS / XLSX / CSV) i .NET
Denne artikel viser, hvordan man programmeret konverterer PDF-dokumenter til Microsoft Excel-formater (XLS, XLSX, CSV, og mere) ved hjælp af Aspose.PDF XLS Converter for .NET. Dette giver dig mulighed for at afslutte, analysere og automatisere dataoverførsel fra PDF’er i spreadsheets for yderligere behandling, rapportering eller arkivering.
Det virkelige problem
Eksport af tabeller eller strukturerede data fra PDF’er til Excel manuelt er arbejdsintens og fejlfrit. Automatisering af denne konvertering er afgørende for arbejdsprocesser i finansiering, rapportering, analyse og overholdelse, hvor massive PDF-til-spredskabsoperationer er nødvendige.
Oversigt over løsning
Aspose.PDF XLS Converter for .NET giver dig mulighed for:
- Konverter enkelt eller flere PDF’er til Excel-filer (XLSX, XLS, CSV, ODS, XML)
- Styring af værktøjskonstruktion og formatering
- Integration med C#/NET-projekter for skalerbar automatisering
Forudsætninger
- Visual Studio 2019 eller senere
- .NET 6.0 eller senere
- Aspose.PDF for .NET installeret via NuGet
PM> Install-Package Aspose.PDF
Step-by-Step gennemførelse
Trin 1: Reference krævede navneområder
using Aspose.Pdf.Plugins;
using System.IO;
Trin 2: Konverter en PDF til XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Brug af tilfælde og applikationer (med kodvariationer)
1. ** Eksport til CSV, XLS, ODS eller XML**
Angiv det ønskede udgangsformat ved hjælp af Format
Ejendommen er:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat for alle understøttede formater.
2. Batch konverterer flere PDF’er til Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. * Minimere antallet af arbejdspladser*
Som standard bliver hver PDF-side til en ny Excel-arbejdsblade. for at gemme alt indhold i en enkelt arbejdsbok:
options.MinimizeTheNumberOfWorksheets = true;
4. ** Angiv en hvid kolonne ved start**
For visse dataimport-scenarier vil du muligvis tilføje en hvid kolonne som den første kolumn:
options.InsertBlankColumnAtFirst = true;
Bedste praksis og tips
- Forhåndsvisning udgang for at verificere tabellarrangement og data integritet, især når du bruger avancerede layout muligheder.
- For store dokumenter bruger du batchbehandling til at automatisere massekonvertering effektivt.
- Når du konverterer til CSV, verificerer du delimitere og koder for downstream kompatibilitet.
- For meget strukturerede eller scannede PDF’er, forudprocessdokumenter for de bedste resultater.
Eksempel på fuld gennemførelse
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Konklusion
Aspose.PDF XLS Converter for .NET muliggør hurtig, robust og fleksibel PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatisering i C# projekter. Unlock data fra PDF’er, streamline analytics, og integrere spreadsheet arbejdsprocesser - alle med en simpel, høj ydeevne API. Se den fulde API Reference for mere format og mulighed detaljer.
Ofte stillede spørgsmål
**Q: Hvilke formater kan jeg eksportere til ud over XLSX?**A: Støttet format omfatter XLSX, XLSM, CSV, ODS og Excel 2003 XML. Format
Ejendomme til at vælge.
**Q: Hvordan kan jeg gemme alle PDF-indholdene i et enkelt worksheet?**A: Set af MinimizeTheNumberOfWorksheets = true
På din PdfToXlsOptions
.
**Q: Hvor kan jeg finde flere eksempler eller få support?**A: Se den officielle Aspose.PDF-dokumentation, API Reference eller kontaktstøtte for avancerede scenarier.