Kako pretvoriti PDF u Excel (XLS / XLSX / CSV) u .NET
Ovaj članak prikazuje kako programski pretvoriti PDF dokumente u Microsoft Excel formate (XLS, XLSX, CSV, i više) pomoću Aspose.PDF XLS Converter za .NET. To vam omogućuje da otključite, analizirati i automatizirati prijenos podataka iz PDF-a u spreadsheets za daljnju obradu, izvješćivanje ili arhiviranje.
Real-svjetski problem
Izvoz tablica ili strukturiranih podataka iz PDF-a u Excel ručno je radno intenzivan i bez pogrešaka. Automatizacija ove konverzije ključna je za tokove rada u financijama, izvješćivanju, analizi i usklađenosti gdje su potrebne operacije u velikoj količini od PDF do brošure.
Pregled rješenja
Aspose.PDF XLS Converter za .NET omogućuje:
- Konvertirati pojedinačne ili više PDF-a u Excel datoteke (XLSX, XLS, CSV, ODS, XML)
- Kontrola strukture radnog lista i formatacije
- Integrirajte se s C#/NET projektima za skalabilnu automatizaciju
Preduzeća
- Visual Studio 2019 ili kasnije
- .NET 6.0 ili noviji
- Aspose.PDF za .NET instaliran preko NuGeta
PM> Install-Package Aspose.PDF
Korak po korak provedba
Korak 1: Potrebni nazivni prostori
using Aspose.Pdf.Plugins;
using System.IO;
Korak 2: Konvertirati PDF na XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Korištenje slučajeva i aplikacija (s varijacijama koda)
1. Izvoz na CSV, XLS, ODS ili XML
određivanje željene formate izlaska pomoću Format
i nekretnine:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat Za sve podržane formate.
2. Batch pretvoriti više PDF-a u Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Minimizirajte broj radnih mjesta
Podrazumevano, svaka PDF stranica postaje novi Excel radni list. da biste sačuvali sve sadržaje u jednom radnom listu:
options.MinimizeTheNumberOfWorksheets = true;
4. Ustavite bijelu stolpcu na početku
Za određene scenarije uvoza podataka, možda želite dodati bijelu stolpcu kao prvu stolpec:
options.InsertBlankColumnAtFirst = true;
Najbolje prakse i savjeti
- Predviđanje izlaska kako bi se provjerila raspored tablice i integritet podataka, osobito kada se koriste napredne mogućnosti rasporeda.
- Za velike dokumente, koristite obradu paketa kako biste učinkovito automatizirali konverziju mase.
- Prilikom pretvaranja u CSV, provjerite delimitere i kodiranje za kompatibilnost downstream.
- Za visoko strukturirane ili skenirane PDF-ove, predprocesni dokumenti za najbolje rezultate.
Potpuni primjer provedbe
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
zaključak
Aspose.PDF XLS Converter za .NET omogućuje brzu, čvrstu i fleksibilnu automatizaciju PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) u C# projektima. otključivanje podataka iz PDF, analize struje i integriranje radnih tokova spreadsheet-sve s jednostavnim, visoke performanse API. pogledajte cijeli API Reference za više detalja formata i opcija.
Često postavljana pitanja
**Q: Koje formate mogu izvoziti osim XLSX-a?**A: Podržani formati uključuju XLSX, XLSM, CSV, ODS i Excel 2003 XML. Format
Proizvodi za odabir.
**Q: Kako mogu sačuvati sve PDF sadržaje u jednom radnom listu?**A: Sastav MinimizeTheNumberOfWorksheets = true
Na tvojoj PdfToXlsOptions
.
**Q: Gdje mogu pronaći više primjera ili dobiti potporu?**Odgovor: Pogledajte službenu dokumentaciju Aspose.PDF, API Reference ili kontaktnu podršku za napredne scenarije.