So konvertieren Sie PDF in Excel (XLS / XLS / CSV) in .NET
Dieser Artikel zeigt Ihnen, wie Sie PDF-Dokumente in Microsoft Excel-Formate (XLS, XLSX, CSV, und mehr) mit dem Aspose.PDF XLS Converter für .NET programmatisch konvertieren können.Dies ermöglicht die Entlockung, Analyse und automatische Datenübertragung von PDFs in Spreadsheets für weitere Verarbeitung, Berichterstattung oder Archivierung.
Real-Weltproblem
Die Exportion von Tabellen oder strukturierten Daten aus PDFs in Excel manuell ist arbeitsintensiv und fehlerfreundlich. Automatisierung dieser Konvertierung ist entscheidend für Arbeitsflüsse in Finanzierung, Berichterstattung, Analyse und Compliance, wo Menge PDF-to-Spreadsheet-Transaktionen erforderlich sind.
Überblick der Lösung
Aspose.PDF XLS Converter für .NET ermöglicht Ihnen:
- Konvertieren Sie einzelne oder mehrere PDFs in Excel-Dateien (XLSX, XLS, CSV, ODS, XML)
- Steuerung der Arbeitsblattstruktur und Formatierung
- Genaue Integration mit C#/NET-Projekten für skalierbare Automatisierung
Voraussetzung
- Visual Studio 2019 oder später
- .NET 6.0 oder höher
- Aspose.PDF für .NET über NuGet installiert
PM> Install-Package Aspose.PDF
Schritt für Schritt Implementierung
Schritt 1: Referenz erforderliche Namenräume
using Aspose.Pdf.Plugins;
using System.IO;
Schritt 2: Umwandeln eines PDF in XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Verwendung von Fällen und Anwendungen (mit Code Variations)
1. Export auf CSV, XLS, ODS oder XML
Angeben Sie das gewünschte Ausgangsformat mit dem Format
Eigentum :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat für alle unterstützten Formate.
2. Batch Convert Multiple PDFs in Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Minimierung der Anzahl der Arbeitsblätter
Standardmäßig wird jede PDF-Seite zu einem neuen Excel-Arbeitsblatt.Um alle Inhalte in einer einzelnen Arbeitsblatte zu speichern:
options.MinimizeTheNumberOfWorksheets = true;
4. Einfügen Sie eine weiße Spalte am Start
Für bestimmte Daten-Import-Szenarien möchten Sie möglicherweise als erste Spalte eine weiße Kolonne hinzufügen:
options.InsertBlankColumnAtFirst = true;
Beste Praktiken und Tipps
- Preview-Ausgang, um die Tabelllayout und die Datenintegrität zu überprüfen, vor allem bei der Verwendung fortschrittlicher layout-Optionen.
- Für große Dokumente verwenden Sie Batch-Verarbeitung, um die Massenkonvertierung effizient zu automatisieren.
- Wenn Sie in CSV konvertieren, überprüfen Sie Delimiters und Codieren für Downstream-Kompatibilität.
- Für hochstrukturierte oder scannende PDF-Dokumente, vorverarbeitete Dokumente für die besten Ergebnisse.
Vollständige Implementierung Example
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Schlussfolgerungen
Der Aspose.PDF XLS Converter für .NET ermöglicht eine schnelle, robuste und flexible PDF-to-Excel-Automatisierung (XLS / XLSX / CSV / XML / ODS) in C#-Projekten.Daten aus PDFs, Streamline Analyse und integrierte Spreadsheet-Workflows – alle mit einer einfachen, hochleistungsfähigen API.
Häufige Fragen
**Q: Welche Formate kann ich neben XLSX exportieren?**A: Unterstützte Formate umfassen XLSX, XLSM, CSV, ODS und Excel 2003 XML. Format
Eigentum zu wählen.
**Q: Wie kann ich alle PDF-Inhalte in einen einzelnen Arbeitsblatt speichern?**A: Set MinimizeTheNumberOfWorksheets = true
Auf deinem PdfToXlsOptions
.
**Q: Wo kann ich weitere Beispiele finden oder Unterstützung erhalten?**A: Siehe die offizielle Aspose.PDF-Dokumentation, API-Referenz oder Kontaktunterstützung für fortgeschrittene Szenarien.