Come convertire PDF in Excel (XLS / XLSX / CSV) in .NET

Come convertire PDF in Excel (XLS / XLSX / CSV) in .NET

Questo articolo mostra come convertire in modo programmatico i documenti PDF in formati Microsoft Excel (XLS, XLSX, CSV, e altro) utilizzando Aspose.PDF XLS Converter per .NET. Questo ti consente di disattivare, analizzare e automatizzare il trasferimento dei dati da PDF a schede per ulteriore elaborazione, reporting o archivio.

Il problema del mondo reale

L’esportazione manuale di tabelle o dati strutturati da PDF a Excel è intenso e sbagliato.L’automazione di questa conversione è vitale per i flussi di lavoro in materia di finanza, reporting, analisi e conformità dove sono necessarie le operazioni in formato PDF-to-spreadheet.

Soluzione Overview

Aspose.PDF XLS Converter per .NET consente di:

  • Convertire file PDF singoli o multiple in file Excel (XLSX, XLS, CSV, ODS, XML)
  • Controlla la struttura del foglio di lavoro e la formattazione
  • Integrazione flessibile con i progetti C#/NET per l’automazione scalabile

Prerequisiti

  • Visual Studio 2019 o successivo
  • .NET 6.0 o successivo
  • Aspose.PDF per .NET installato tramite NuGet
PM> Install-Package Aspose.PDF

Implementazione passo dopo passo

Passo 1: Referenza degli spazi di nome richiesti

using Aspose.Pdf.Plugins;
using System.IO;

Passo 2: Convertire un PDF in XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Cassi e applicazioni di utilizzo (con variazioni di codice)

1. Esportazione a CSV, XLS, ODS o XML

Determinare il formato di uscita desiderato utilizzando il Format di proprietà:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormato per tutti i formati supportati.

2. Batch Convertire PDF multipli in Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimo il numero di fogli di lavoro

Per impostazione predefinita, ogni pagina PDF diventa una nuova scheda di lavoro di Excel. Per salvare tutti i contenuti in una singola schede:

options.MinimizeTheNumberOfWorksheets = true;

4. Inserire una colonna bianca all’inizio

Per alcuni scenari di importazione dei dati, è possibile aggiungere una colonna bianca come la prima:

options.InsertBlankColumnAtFirst = true;

Migliori pratiche e consigli

  • Preview output per verificare la layout della tabella e l’integrità dei dati, specialmente quando si utilizzano le opzioni avanzate.
  • Per i documenti di grandi dimensioni, utilizzare il processamento di batch per automatizzare la conversione di massa in modo efficiente.
  • Quando si converte in CSV, verifica i delimitori e codifica per la compatibilità downstream.
  • Per i PDF altamente strutturati o scansionati, i documenti pre-processo per i migliori risultati.

Esempio completo di attuazione

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

conclusione

L’Aspose.PDF XLS Converter per .NET consente la rapida, robusta e flessibile automatizzazione PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) in progetti C#. Rimuovere i dati da PDF, analisi di linee guida e integrare i flussi di lavoro della scheda di diffusione - tutti con un semplice API ad alto rendimento.

Domande frequenti

**Q: Quali formati posso esportare oltre a XLSX?**A: I formati supportati includono XLSX, XLSM, CSV, ODS e Excel 2003 XML. Format Proprietà da scegliere.

**Q: Come posso salvare tutti i contenuti PDF in un singolo foglio di lavoro?**A: il set MinimizeTheNumberOfWorksheets = true sul tuo PdfToXlsOptions.

**Q: Dove posso trovare altri esempi o ottenere il supporto?**A: Vedi la documentazione ufficiale Aspose.PDF, API Reference, o supporto di contatto per scenari avanzati.

 Italiano