Come convertire PDF in Excel (XLS / XLSX / CSV) in .NET
Questo articolo mostra come convertire in modo programmatico i documenti PDF in formati Microsoft Excel (XLS, XLSX, CSV, e altro) utilizzando Aspose.PDF XLS Converter per .NET. Questo ti consente di disattivare, analizzare e automatizzare il trasferimento dei dati da PDF a schede per ulteriore elaborazione, reporting o archivio.
Il problema del mondo reale
L’esportazione manuale di tabelle o dati strutturati da PDF a Excel è intenso e sbagliato.L’automazione di questa conversione è vitale per i flussi di lavoro in materia di finanza, reporting, analisi e conformità dove sono necessarie le operazioni in formato PDF-to-spreadheet.
Soluzione Overview
Aspose.PDF XLS Converter per .NET consente di:
- Convertire file PDF singoli o multiple in file Excel (XLSX, XLS, CSV, ODS, XML)
- Controlla la struttura del foglio di lavoro e la formattazione
- Integrazione flessibile con i progetti C#/NET per l’automazione scalabile
Prerequisiti
- Visual Studio 2019 o successivo
- .NET 6.0 o successivo
- Aspose.PDF per .NET installato tramite NuGet
PM> Install-Package Aspose.PDF
Implementazione passo dopo passo
Passo 1: Referenza degli spazi di nome richiesti
using Aspose.Pdf.Plugins;
using System.IO;
Passo 2: Convertire un PDF in XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Cassi e applicazioni di utilizzo (con variazioni di codice)
1. Esportazione a CSV, XLS, ODS o XML
Determinare il formato di uscita desiderato utilizzando il Format
di proprietà:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormato per tutti i formati supportati.
2. Batch Convertire PDF multipli in Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Minimo il numero di fogli di lavoro
Per impostazione predefinita, ogni pagina PDF diventa una nuova scheda di lavoro di Excel. Per salvare tutti i contenuti in una singola schede:
options.MinimizeTheNumberOfWorksheets = true;
4. Inserire una colonna bianca all’inizio
Per alcuni scenari di importazione dei dati, è possibile aggiungere una colonna bianca come la prima:
options.InsertBlankColumnAtFirst = true;
Migliori pratiche e consigli
- Preview output per verificare la layout della tabella e l’integrità dei dati, specialmente quando si utilizzano le opzioni avanzate.
- Per i documenti di grandi dimensioni, utilizzare il processamento di batch per automatizzare la conversione di massa in modo efficiente.
- Quando si converte in CSV, verifica i delimitori e codifica per la compatibilità downstream.
- Per i PDF altamente strutturati o scansionati, i documenti pre-processo per i migliori risultati.
Esempio completo di attuazione
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
conclusione
L’Aspose.PDF XLS Converter per .NET consente la rapida, robusta e flessibile automatizzazione PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) in progetti C#. Rimuovere i dati da PDF, analisi di linee guida e integrare i flussi di lavoro della scheda di diffusione - tutti con un semplice API ad alto rendimento.
Domande frequenti
**Q: Quali formati posso esportare oltre a XLSX?**A: I formati supportati includono XLSX, XLSM, CSV, ODS e Excel 2003 XML. Format
Proprietà da scegliere.
**Q: Come posso salvare tutti i contenuti PDF in un singolo foglio di lavoro?**A: il set MinimizeTheNumberOfWorksheets = true
sul tuo PdfToXlsOptions
.
**Q: Dove posso trovare altri esempi o ottenere il supporto?**A: Vedi la documentazione ufficiale Aspose.PDF, API Reference, o supporto di contatto per scenari avanzati.