Ako premeniť PDF na Excel (XLS / XLSX / CSV) v .NET

Ako premeniť PDF na Excel (XLS / XLSX / CSV) v .NET

Tento článok ukazuje, ako programovo previesť PDF dokumenty do Microsoft Excel formátov (XLS, XLSX, CSV, a ďalšie) pomocou Aspose.PDF XLS Converter pre .NET. To vám umožní odomknúť, analyzovať a automaticky prenášať údaje z PDF do šípky pre ďalšie spracovanie, reporting, alebo archivácia.

Reálny svetový problém

Export tabuľky alebo štruktúrované údaje z PDF do Excelu manuálne je pracovná intenzita a chýb. Automatizácia tejto konverzie je nevyhnutná pre pracovné toky v oblasti financií, správy, analýzy a dodržiavania, kde sú potrebné operácie vo veľkom množstve PDF na šírenie.

Prehľad riešenia

Aspose.PDF XLS Converter pre .NET vám umožňuje:

  • Konvertovať jednotlivé alebo viaceré PDF do Excel súborov (XLSX, XLS, CSV, ODS, XML)
  • Kontrola štruktúry a formátovania
  • Plne integrovať s projektmi C#/NET pre skalovateľnú automatizáciu

Predpoklady

  • Visual Studio 2019 alebo neskôr
  • .NET 6.0 alebo novšie
  • Aspose.PDF pre .NET nainštalovaný prostredníctvom NuGet
PM> Install-Package Aspose.PDF

krok za krokom implementácia

Krok 1: Odkaz na požadované názvové priestory

using Aspose.Pdf.Plugins;
using System.IO;

Krok 2: Konvertovať PDF na XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Použitie prípadov a aplikácií (s kódovými variáciami)

1. Export na CSV, XLS, ODS alebo XML

Určiť požadovaný formát výstupu pomocou Format Vlastníctvo :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormát pre všetky podporované formáty.

2. Batch Convert Multiple PDFs to Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimalizácia počtu pracovných listov

V predvolenom nastavení sa každá stránka PDF stáva novým pracovným listom programu Excel. Ak chcete uložiť celý obsah do jedného pracovného listu:

options.MinimizeTheNumberOfWorksheets = true;

4. Vložte biely stĺpec na začiatku

Pre určité scénáre importov údajov môžete pridať bielu stĺpec ako prvú:

options.InsertBlankColumnAtFirst = true;

Najlepšie postupy a tipy

  • Predbežný výstup na overenie rozloženia tabuľky a integrity údajov, najmä pri používaní pokročilých možností nastavenia.
  • V prípade veľkých dokumentov použite batch spracovanie na automatizáciu hromadnej konverzie efektívne.
  • Pri konverzii na CSV skontrolujte delimitéry a kódovanie pre kompatibilitu s nízkym prúdom.
  • Pre vysoko štruktúrované alebo skenované PDF dokumenty pre najlepšie výsledky.

Kompletný príklad realizácie

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Záver

Aspose.PDF XLS Converter pre .NET umožňuje rýchlu, robustnú a flexibilnú automatizáciu PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) v projektoch C#. Odomknúť údaje z PDF, streamline analýzy a integrovať pracovné toky spreadsheet - všetko s jednoduchým, vysoko výkonným API. Pozrite si celý odkaz API pre viac informácií o formáte a možnosti.

Často kladené otázky

**Q: Aké formáty môžem exportovať na okrem XLSX?**A: Podporované formáty zahŕňajú XLSX, XLSM, CSV, ODS a Excel 2003 XML. Format Majetok si vybrať.

**Q: Ako môžem uložiť celý obsah PDF do jedného pracovného listu?**A: súprava MinimizeTheNumberOfWorksheets = true Na tvojej PdfToXlsOptions.

**Q: Kde môžem nájsť viac príkladov alebo získať podporu?**Odpoveď: Pozrite si oficiálnu dokumentáciu Aspose.PDF, odkaz API alebo kontaktnú podporu pre pokročilé scenáre.

 Slovenčina