Hoe om te converteren PDF naar Excel (XLS / XLSX / CSV) in .NET

Hoe om te converteren PDF naar Excel (XLS / XLSX / CSV) in .NET

Dit artikel laat zien hoe u PDF-documenten programmatisch kunt converteren in Microsoft Excel-formaat (XLS, XLSX, CSV, en meer) met behulp van de Aspose.PDF XLS Converter voor .NET. Dit maakt het mogelijk om gegevens te ontgrendelen, te analyseren en automatisch over te dragen van PDF’s naar spreadsheets voor verdere verwerking, rapportage of archief.

Real-wereld probleem

Het exporteren van tabellen of gestructureerde gegevens van PDF’s naar Excel handmatig is werk intensief en foutloos. Automatiseren van deze conversie is essentieel voor werkstromen in financiën, rapportage, analyse en compliance waar bulk PDF-to-breadsheet operaties nodig zijn.

Overzicht oplossingen

Aspose.PDF XLS Converter voor .NET laat u:

  • Convert een of meerdere PDF’s naar Excel-bestanden (XLSX, XLS, CSV, ODS, XML)
  • Controle worksheet structuur en formatting
  • Eenvoudig integreren met C#/NET-projecten voor schaalbare automatisering

Voorwaarden

  • Visual Studio 2019 of later
  • .NET 6.0 of later
  • Aspose.PDF voor .NET geïnstalleerd via NuGet
PM> Install-Package Aspose.PDF

Stap voor stap implementatie

Stap 1: Referentie vereiste naamruimten

using Aspose.Pdf.Plugins;
using System.IO;

Stap 2: Convert een PDF naar XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Gebruik Cases & Applicaties (met code variaties)

1. Export naar CSV, XLS, ODS of XML

Bepaal het gewenste outputformaat met behulp van de Format De eigendom:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat Voor alle ondersteunde formaten.

2. Batch Convert meerdere PDF’s naar Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimum aantal werkbladen

Door standaard wordt elke PDF-pagina een nieuw Excel-werkblad. om alle inhoud in één werkblad te bewaren:

options.MinimizeTheNumberOfWorksheets = true;

4. Installeer een witte kolom aan het begin

Voor bepaalde data-importscenario’s wilt u mogelijk een witte kolom toevoegen als de eerste column:

options.InsertBlankColumnAtFirst = true;

Beste praktijken en tips

  • Preview output om de tabellijst en gegevensintegriteit te controleren, vooral wanneer u geavanceerde layout-opties gebruikt.
  • Voor grote documenten, gebruik batchverwerking om de massa conversie efficiënt te automatiseren.
  • Bij het converteren naar CSV, controleer de delimiters en coderen voor downstream compatibiliteit.
  • Voor zeer gestructureerde of gescande PDF’s, pre-procesdocumenten voor beste resultaten.

Volledige implementatie voorbeeld

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusie

De Aspose.PDF XLS Converter voor .NET zorgt voor snelle, robuste en flexibele PDF-to-Excel-automatisatie (XLS / XLSX / CSV / XML / ODS) in C#-projecten.Daten ontgrendelen van PDF’s, streamline-analyse en geïntegreerde spreadsheet werkstromen - allemaal met een eenvoudige, hoogwaardige API.

Vaak gestelde vragen

**Q: Welke formaten kan ik exporteren naar naast XLSX?**A: Ondersteunde formaten zijn XLSX, XLSM, CSV, ODS en Excel 2003 XML. Format eigendom te kiezen.

**Q: Hoe kan ik alle PDF-inhoud opslaan in één werkblad?**A: een set MinimizeTheNumberOfWorksheets = true op uw PdfToXlsOptions.

**Q: Waar kan ik meer voorbeelden vinden of ondersteuning krijgen?**A: Bekijk de officiële Aspose.PDF-documentatie, API-referentie of contact ondersteuning voor geavanceerde scenario’s.

 Nederlands