Cum să convertiți PDF în Excel (XLS / XLSX / CSV) în .NET

Cum să convertiți PDF în Excel (XLS / XLSX / CSV) în .NET

Acest articol arată cum să convertiți în mod programat documentele PDF în formate Microsoft Excel (XLS, XLSX, CSV, și mai mult) folosind Aspose.PDF XLS Converter pentru .NET. Acest lucru vă permite să descărcați, să analizați și să automatizați transferul de date din PDF-uri în etichete pentru prelucrarea ulterioară, raportarea sau arhivarea.

Problema lumii reale

Exportarea manuală a tabelelor sau a datelor structurate din PDF-uri în Excel este intensă de lucru și lipsită de erori. Automatizarea acestei conversii este esențială pentru fluxurile de muncă în finanțe, raportare, analiză și conformitate, în cazul în care sunt necesare operațiunile bulk-PDF-to-spreadsheet.

Soluție de ansamblu

Aspose.PDF XLS Converter pentru .NET vă permite:

  • Convertați fișiere PDF singure sau multiple la Excel (XLSX, XLS, CSV, ODS, XML)
  • Controlul structurii și formatării tabloului de lucru
  • Integrarea fluidă cu proiectele C#/NET pentru automatizarea scalabilă

Prevederile

  • Visual Studio 2019 sau mai târziu
  • .NET 6.0 sau mai târziu
  • Aspose.PDF pentru .NET instalat prin NuGet
PM> Install-Package Aspose.PDF

Implementarea pas cu pas

Pasul 1: Spatiile de referinta necesare

using Aspose.Pdf.Plugins;
using System.IO;

Pasul 2: Conversați un PDF în XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Utilizarea cazurilor și aplicațiilor (cu variații de cod)

1. Export la CSV, XLS, ODS sau XML

Specificați formatul de ieșire dorit folosind Format Proprietăți :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat pentru toate formatele suportate.

2. Batch convertează mai multe PDF-uri în Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimalizarea numărului de cărți de lucru

De preferință, fiecare pagină PDF devine o fila de lucru Excel nouă. pentru a salva toate conținutul într-o singură foaie:

options.MinimizeTheNumberOfWorksheets = true;

4. Introduceți o coloană albă la început

Pentru anumite scenarii de import de date, este posibil să doriți să adăugați o coloană albă ca prima coloană:

options.InsertBlankColumnAtFirst = true;

Cele mai bune practici și sfaturi

  • Preview output pentru a verifica setarea tabelului și integritatea datelor, mai ales atunci când utilizați opțiuni avansate de setare.
  • Pentru documentele mari, folosiți procesarea batch-ului pentru a automatiza conversia în masă eficient.
  • Atunci când convertiți în CSV, verificați delimitatorii și codificați pentru compatibilitatea downstream.
  • Pentru PDF-uri foarte structurate sau scanate, documente pre-proces pentru cele mai bune rezultate.

Exemplu complet de implementare

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

concluziile

Aspose.PDF XLS Converter pentru .NET permite automatizarea rapidă, robustă și flexibilă a PDF-to-Excel (XLS/X LSX/CSV/ XML/ODS) în proiecte C#. Desbloquează datele din PDF, analize de curent și integrează fluxurile de lucru spreadsheet – toate cu un API simplu, de înaltă performanță.

Întrebări frecvente

**Q: Ce formate pot exporta în afară de XLSX?**A: Formatele suportate includ XLSX, XLSM, CSV, ODS și Excel 2003 XML. Format Proprietăți pentru a alege.

**Q: Cum pot salva toate conținuturile PDF într-o singură hârtie de lucru?**A: Setul MinimizeTheNumberOfWorksheets = true pe tine PdfToXlsOptions.

**Q: Unde pot găsi mai multe exemple sau pot obține sprijin?**A: A se vedea documentația oficială Aspose.PDF, API Referință sau suport de contact pentru scenarii avansate.

 Română