Jak převést PDF na Excel (XLS / XLSX / CSV) v .NET
Tento článek ukazuje, jak programově převést PDF dokumenty do formátů Microsoft Excel (XLS, XLSX, CSV a další) pomocí ASPOSE.PDF XLS Converter pro .NET. To vám umožní odemknout, analyzovat a automatizovat přenos dat z PDF do šířek pro další zpracování, hlášení nebo archivování.
Reálný světový problém
Export tabulek nebo strukturovaných dat z PDF do Excelu ručně je pracovně intenzivní a chybově odolný. Automatizace této konverze je nezbytná pro pracovní toky v oblasti financí, hlášení, analýzy a dodržování požadavků, kde jsou zapotřebí velké operace PDF na šířku.
Řešení přehled
Aspose.PDF XLS Converter pro .NET vám umožňuje:
- Konvertovat jednotlivé nebo více PDF do Excelových souborů (XLSX, XLS, CSV, ODS, XML)
- Kontrola struktury a formátování
- Integrace s projektem C#/NET pro skalovatelnou automatizaci
Předpoklady
- Visual Studio 2019 nebo novější
- .NET 6.0 nebo novější
- Aspose.PDF pro .NET instalován prostřednictvím NuGet
PM> Install-Package Aspose.PDF
krok za krokem implementace
Krok 1: Reference požadovaných jmenových prostor
using Aspose.Pdf.Plugins;
using System.IO;
Krok 2: Převod PDF na XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Použití případů a aplikací (s kódovými variacemi)
1. Export na CSV, XLS, ODS nebo XML
Určete požadovaný formát výstupu pomocí Format
Vlastnictví :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormát pro všechny podporované formáty.
2. Batch Convert Multiple PDFs to Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Minimalizujte počet pracovních desek
Ve výchozím nastavení se každá stránka PDF stává novým pracovním listem programu Excel. Chcete-li uložit veškerý obsah do jednoho pracovního listu:
options.MinimizeTheNumberOfWorksheets = true;
4. Vložte bílý sloupec na začátku
Pro určité scénáře dovozu dat můžete chtít přidat bílý sloupec jako první sloučeninu:
options.InsertBlankColumnAtFirst = true;
Nejlepší postupy a tipy
- Předpověď výstupu pro ověření rozložení tabulky a integrity dat, zejména při používání pokročilých možností uspořádání.
- Pro velké dokumenty použijte batch zpracování k automatizaci hromadné konverze efektivně.
- Při konverzi na CSV ověřte delimitéry a kódování pro downstream kompatibilitu.
- Pro vysoce strukturované nebo skenované PDF, předprocesní dokumenty pro nejlepší výsledky.
Kompletní příklad provádění
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
závěr
Aspose.PDF XLS Converter pro .NET umožňuje rychlou, robustní a flexibilní automatizaci PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) v projektech C#. Odemknout data z PDF, streamline analýzy a integrovat pracovní toky šířky - vše s jednoduchou, vysoce výkonnou API.
Často kladené otázky
**Q: Jaké formáty mohu exportovat kromě XLSX?**Odpověď: Podporované formáty zahrnují XLSX, XLSM, CSV, ODS a Excel 2003 XML. Format
Vlastnictví pro výběr.
**Q: Jak mohu uložit veškerý obsah PDF do jedné desky?**A – Set MinimizeTheNumberOfWorksheets = true
Na tvém PdfToXlsOptions
.
**Q: Kde mohu najít další příklady nebo získat podporu?**Odpověď: Viz oficiální dokumentaci Aspose.PDF, odkaz API nebo kontaktní podpora pro pokročilé scénáře.