So konvertieren Sie PDF in Excel (XLS / XLS / CSV) in .NET

So konvertieren Sie PDF in Excel (XLS / XLS / CSV) in .NET

Dieser Artikel zeigt Ihnen, wie Sie PDF-Dokumente in Microsoft Excel-Formate (XLS, XLSX, CSV, und mehr) mit dem Aspose.PDF XLS Converter für .NET programmatisch konvertieren können.Dies ermöglicht die Entlockung, Analyse und automatische Datenübertragung von PDFs in Spreadsheets für weitere Verarbeitung, Berichterstattung oder Archivierung.

Real-Weltproblem

Die Exportion von Tabellen oder strukturierten Daten aus PDFs in Excel manuell ist arbeitsintensiv und fehlerfreundlich. Automatisierung dieser Konvertierung ist entscheidend für Arbeitsflüsse in Finanzierung, Berichterstattung, Analyse und Compliance, wo Menge PDF-to-Spreadsheet-Transaktionen erforderlich sind.

Überblick der Lösung

Aspose.PDF XLS Converter für .NET ermöglicht Ihnen:

  • Konvertieren Sie einzelne oder mehrere PDFs in Excel-Dateien (XLSX, XLS, CSV, ODS, XML)
  • Steuerung der Arbeitsblattstruktur und Formatierung
  • Genaue Integration mit C#/NET-Projekten für skalierbare Automatisierung

Voraussetzung

  • Visual Studio 2019 oder später
  • .NET 6.0 oder höher
  • Aspose.PDF für .NET über NuGet installiert
PM> Install-Package Aspose.PDF

Schritt für Schritt Implementierung

Schritt 1: Referenz erforderliche Namenräume

using Aspose.Pdf.Plugins;
using System.IO;

Schritt 2: Umwandeln eines PDF in XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Verwendung von Fällen und Anwendungen (mit Code Variations)

1. Export auf CSV, XLS, ODS oder XML

Angeben Sie das gewünschte Ausgangsformat mit dem Format Eigentum :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat für alle unterstützten Formate.

2. Batch Convert Multiple PDFs in Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimierung der Anzahl der Arbeitsblätter

Standardmäßig wird jede PDF-Seite zu einem neuen Excel-Arbeitsblatt.Um alle Inhalte in einer einzelnen Arbeitsblatte zu speichern:

options.MinimizeTheNumberOfWorksheets = true;

4. Einfügen Sie eine weiße Spalte am Start

Für bestimmte Daten-Import-Szenarien möchten Sie möglicherweise als erste Spalte eine weiße Kolonne hinzufügen:

options.InsertBlankColumnAtFirst = true;

Beste Praktiken und Tipps

  • Preview-Ausgang, um die Tabelllayout und die Datenintegrität zu überprüfen, vor allem bei der Verwendung fortschrittlicher layout-Optionen.
  • Für große Dokumente verwenden Sie Batch-Verarbeitung, um die Massenkonvertierung effizient zu automatisieren.
  • Wenn Sie in CSV konvertieren, überprüfen Sie Delimiters und Codieren für Downstream-Kompatibilität.
  • Für hochstrukturierte oder scannende PDF-Dokumente, vorverarbeitete Dokumente für die besten Ergebnisse.

Vollständige Implementierung Example

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Schlussfolgerungen

Der Aspose.PDF XLS Converter für .NET ermöglicht eine schnelle, robuste und flexible PDF-to-Excel-Automatisierung (XLS / XLSX / CSV / XML / ODS) in C#-Projekten.Daten aus PDFs, Streamline Analyse und integrierte Spreadsheet-Workflows – alle mit einer einfachen, hochleistungsfähigen API.

Häufige Fragen

**Q: Welche Formate kann ich neben XLSX exportieren?**A: Unterstützte Formate umfassen XLSX, XLSM, CSV, ODS und Excel 2003 XML. Format Eigentum zu wählen.

**Q: Wie kann ich alle PDF-Inhalte in einen einzelnen Arbeitsblatt speichern?**A: Set MinimizeTheNumberOfWorksheets = true Auf deinem PdfToXlsOptions.

**Q: Wo kann ich weitere Beispiele finden oder Unterstützung erhalten?**A: Siehe die offizielle Aspose.PDF-Dokumentation, API-Referenz oder Kontaktunterstützung für fortgeschrittene Szenarien.

 Deutsch