Hur man konverterar PDF till Excel (XLS / XLS / CSV) i .NET
Denna artikel visar hur man programmerar omvandling PDF dokument i Microsoft Excel-format (XLS, XLSX, CSV och mer) med Aspose.PDF XLS Konverter för .NET. Detta gör att du kan låsa upp, analysera och automatiskt överföra data från PDF-filer till skivor för vidare bearbetning, rapportering eller arkivering.
Realvärldsproblem
Exportera tabeller eller strukturerade data från PDF-filer till Excel manuellt är arbetsintens och felfria. Automatisering av denna omvandling är viktig för arbetsflöden i finansiering, rapportering, analys och överensstämmelse där bulk-PDF-to-spreadheet-operationer behövs.
Översikt över lösningen
Aspose.PDF XLS Converter för .NET låter dig:
- Konvertera en eller flera PDF-filer till Excel (XLSX, XLS, CSV, ODS, XML)
- Kontroll worksheet struktur och formatering
- Integrera smidigt med C#/NET-projekt för skalbar automatisering
förutsättningar
- Visual Studio 2019 eller senare
- .NET 6.0 eller senare
- Aspose.PDF för .NET installerat via NuGet
PM> Install-Package Aspose.PDF
Steg för steg genomförande
Steg 1: Referens Nödvändiga Namnutrymmen
using Aspose.Pdf.Plugins;
using System.IO;
Steg 2: Konvertera en PDF till XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Använd Cases & Applications (med kodvariationer)
1. Export till CSV, XLS, ODS eller XML
Ange önskad utgångsformat med hjälp av Format
och fastighet:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat för alla stödda format.
2. Batch Konvertera flera PDF-filer till Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Minimera antalet arbetsblad
Som standard blir varje PDF-sida en ny Excel-arbetsbok. För att spara allt innehåll i en enda arbetsbok:
options.MinimizeTheNumberOfWorksheets = true;
4. Ange en vit kolumn vid start
För vissa dataimport scenarier kanske du vill lägga till en vit kolumn som den första kolumnen:
options.InsertBlankColumnAtFirst = true;
Bästa metoder och tips
- Förhandsvisning av utgången för att verifiera tabelllagring och dataintegritet, särskilt när du använder avancerade layoutalternativ.
- För stora dokument använder du batchbehandling för att automatisera bulkkonvertering effektivt.
- När du konverterar till CSV, verifiera delimitörer och kodning för downstream kompatibilitet.
- För mycket strukturerade eller skannade PDF-dokument för bästa resultat.
Exempel på fullständig genomförande
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
slutsatser
Aspose.PDF XLS Converter för .NET möjliggör snabb, robust och flexibel PDF-to-Excel automatisering (XLS / XLSX / CSV / XML / ODS) i C#-projekt. Låsa upp data från PDFs, strömlinjeanalyser och integrera arbetsflöden - alla med en enkel, högpresterande API. Se den fullständiga API-referensen för mer format och alternativ detaljer.
Ofta ställda frågor
**Q: Vilka format kan jag exportera till förutom XLSX?**A: Stödda format inkluderar XLSX, XLSM, CSV, ODS och Excel 2003 XML Format
Fastighet att välja.
**Q: Hur kan jag spara allt PDF-innehåll i en enda arbetsbok?**A: Sätt MinimizeTheNumberOfWorksheets = true
På din PdfToXlsOptions
.
**Q: Var kan jag hitta fler exempel eller få stöd?**A: Se den officiella Aspose.PDF-dokumentationen, API-referensen eller kontaktsupporten för avancerade scenarier.