Com convertir PDF a Excel (XLS / XLSX / CSV) en .NET

Com convertir PDF a Excel (XLS / XLSX / CSV) en .NET

Aquest article mostra com programàticament convertir documents PDF en formats de Microsoft Excel (XLS, XLSX, CSV, i més) utilitzant l’Aspose.PDF XLS Converter per .NET. Això li permet desbloquejar, analitzar i automatitzar la transferència de dades de PDFs a tauletes per a més processament, reportatge o arxivament.

El problema del món real

L’exportació de taules o dades estructurades de PDF a Excel manualment és intensa en el treball i per error. Automatitzar aquesta conversió és vital per als fluxos de treball en finances, reportatge, anàlisi i compliment on s’han de realitzar operacions de format PDF-a-segat.

Revisió de solucions

Aspose.PDF XLS Converter per a .NET li permet:

  • Convertir PDFs únics o múltiples a fitxers d’Excel (XLSX, XLS, CSV, ODS, XML)
  • Control de l’estructura de la taula de treball i el format
  • Integra’t amb els projectes C#/NET per a l’automatització escalable

Prerequisits

  • Visual Studio 2019 o posterior
  • .NET 6.0 o posterior
  • Aspose.PDF per a .NET instal·lat a través de NuGet
PM> Install-Package Aspose.PDF

Implementació de pas a pas

Pas 1: Referència dels espais de nom requerits

using Aspose.Pdf.Plugins;
using System.IO;

Pas 2: Convertir un PDF a XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Utilitzar Casos i aplicacions (amb variacions de codi)

1. Exportació a CSV, XLS, ODS o XML

Especifica el format de sortida desitjat utilitzant el Format La propietat:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat per a tots els formats recolzats.

2. Batch Convertir PDFs múltiples a Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimitzar el nombre de taules de treball

Per default, cada pàgina PDF es converteix en una nova taula de treball d’Excel. Per salvar tots els continguts en un sol tauleta:

options.MinimizeTheNumberOfWorksheets = true;

4. Insereix una columna blanca al començament

Per a certs escenaris d’importació de dades, pot ser que vulgueu afegir una columna blanca com la primera columna:

options.InsertBlankColumnAtFirst = true;

Millors pràctiques i consells

  • Previsió de la sortida per verificar el disseny de taula i la integritat de les dades, especialment quan s’utilitzen les opcions d’elaboració avançada.
  • Per a documents grans, utilitzeu el processament de batxes per automatitzar la conversió en massa de manera eficient.
  • Quan es converteix en CSV, verifica els delimitors i codifica per a la compatibilitat de baix flux.
  • Per a PDFs altament estructurats o escanejats, documents preprocessos per als millors resultats.

Exemple complet d’implementació

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusió

L’Aspose.PDF XLS Converter per a .NET permet l’automatització ràpida, robusta i flexible de PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) en projectes C#. Desbloquejar dades dels PDFs, anàlisis de rellevància i integrar fluxos de treball de fletxa -tots amb una simple API d’alt rendiment.

Preguntes freqüents

**Q: Quins formats puc exportar a més de XLSX?**A: Els formats recolzats inclouen XLSX, XLSM, CSV, ODS i Excel 2003 XML. Format Propietat per seleccionar.

**Q: Com puc guardar tots els continguts PDF en un sol full de treball?**A: El set MinimizeTheNumberOfWorksheets = true En el teu PdfToXlsOptions.

**Q: On puc trobar més exemples o obtenir suport?**A: Veure la documentació oficial Aspose.PDF, API Referència, o suport de contacte per a escenaris avançats.

 Català