Jak převést PDF na Excel (XLS / XLSX / CSV) v .NET

Jak převést PDF na Excel (XLS / XLSX / CSV) v .NET

Tento článek ukazuje, jak programově převést PDF dokumenty do formátů Microsoft Excel (XLS, XLSX, CSV a další) pomocí ASPOSE.PDF XLS Converter pro .NET. To vám umožní odemknout, analyzovat a automatizovat přenos dat z PDF do šířek pro další zpracování, hlášení nebo archivování.

Reálný světový problém

Export tabulek nebo strukturovaných dat z PDF do Excelu ručně je pracovně intenzivní a chybově odolný. Automatizace této konverze je nezbytná pro pracovní toky v oblasti financí, hlášení, analýzy a dodržování požadavků, kde jsou zapotřebí velké operace PDF na šířku.

Řešení přehled

Aspose.PDF XLS Converter pro .NET vám umožňuje:

  • Konvertovat jednotlivé nebo více PDF do Excelových souborů (XLSX, XLS, CSV, ODS, XML)
  • Kontrola struktury a formátování
  • Integrace s projektem C#/NET pro skalovatelnou automatizaci

Předpoklady

  • Visual Studio 2019 nebo novější
  • .NET 6.0 nebo novější
  • Aspose.PDF pro .NET instalován prostřednictvím NuGet
PM> Install-Package Aspose.PDF

krok za krokem implementace

Krok 1: Reference požadovaných jmenových prostor

using Aspose.Pdf.Plugins;
using System.IO;

Krok 2: Převod PDF na XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Použití případů a aplikací (s kódovými variacemi)

1. Export na CSV, XLS, ODS nebo XML

Určete požadovaný formát výstupu pomocí Format Vlastnictví :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormát pro všechny podporované formáty.

2. Batch Convert Multiple PDFs to Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimalizujte počet pracovních desek

Ve výchozím nastavení se každá stránka PDF stává novým pracovním listem programu Excel. Chcete-li uložit veškerý obsah do jednoho pracovního listu:

options.MinimizeTheNumberOfWorksheets = true;

4. Vložte bílý sloupec na začátku

Pro určité scénáře dovozu dat můžete chtít přidat bílý sloupec jako první sloučeninu:

options.InsertBlankColumnAtFirst = true;

Nejlepší postupy a tipy

  • Předpověď výstupu pro ověření rozložení tabulky a integrity dat, zejména při používání pokročilých možností uspořádání.
  • Pro velké dokumenty použijte batch zpracování k automatizaci hromadné konverze efektivně.
  • Při konverzi na CSV ověřte delimitéry a kódování pro downstream kompatibilitu.
  • Pro vysoce strukturované nebo skenované PDF, předprocesní dokumenty pro nejlepší výsledky.

Kompletní příklad provádění

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

závěr

Aspose.PDF XLS Converter pro .NET umožňuje rychlou, robustní a flexibilní automatizaci PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) v projektech C#. Odemknout data z PDF, streamline analýzy a integrovat pracovní toky šířky - vše s jednoduchou, vysoce výkonnou API.

Často kladené otázky

**Q: Jaké formáty mohu exportovat kromě XLSX?**Odpověď: Podporované formáty zahrnují XLSX, XLSM, CSV, ODS a Excel 2003 XML. Format Vlastnictví pro výběr.

**Q: Jak mohu uložit veškerý obsah PDF do jedné desky?**A – Set MinimizeTheNumberOfWorksheets = true Na tvém PdfToXlsOptions.

**Q: Kde mohu najít další příklady nebo získat podporu?**Odpověď: Viz oficiální dokumentaci Aspose.PDF, odkaz API nebo kontaktní podpora pro pokročilé scénáře.

 Čeština