Kaip konvertuoti PDF į Excel (XLS / XLSX / CSV) į .NET
Šiame straipsnyje parodyta, kaip programuojamai konvertuoti PDF dokumentus į „Microsoft Excel“ formatus (XLS, XLSX, CSV ir kt.) naudojant „Aspose.PDF XL S Converter“ .NET. Tai leidžia atverti, analizuoti ir automatiškai perkelti duomenis iš PDF į plokšteles tolesniam apdorojimui, ataskaitų teikimui ar archyvavimui.
Realaus pasaulio problemos
Eksportuoti lenteles ar struktūrizuotus duomenis iš PDF į Excel rankiniu būdu yra intensyvus darbas ir klaidų priežastis. Automatizuoti šią konvertavimą yra labai svarbu darbo srautams finansuose, ataskaitose, analizėje ir atitikties srityse, kuriose reikalingos didelės apimties PDF-to-preadsheet operacijos.
Sprendimo apžvalga
Aspose.PDF XLS Converter for .NET leidžia jums:
- Vieno ar kelių PDF failų konvertavimas į Excel failus (XLSX, XLS, CSV, ODS, XML)
- Kontrolės darbalaukio struktūra ir formatavimas
- Lengvai integruokite su C#/NET projektais, kad galėtumėte skalauti automatizavimą
Prerequisites
- „Visual Studio 2019“ arba vėliau
- .NET 6.0 arba naujesnė
- Aspose.PDF už .NET įdiegtas per NuGet
PM> Install-Package Aspose.PDF
Žingsnis po žingsnio įgyvendinimas
1 žingsnis: Reikalingos pavadinimų erdvės
using Aspose.Pdf.Plugins;
using System.IO;
2 žingsnis: konvertuoti PDF į XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Naudokite atvejus ir paraiškas (su kodo variacijomis)
1. Exportuoti į CSV, XLS, ODS arba XML
Nustatykite pageidaujamą išleidimo formatą naudojant Format
Nekilnojamojo turto:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormatas Visi remiami formatai.
2. Batch konvertuoti daug PDF į Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. * Minimalizuokite darbų skaičių*
Pavyzdžiui, kiekvienas PDF puslapis tampa nauju „Excel“ darbalauku. norint išsaugoti visą turinį viename darbale:
options.MinimizeTheNumberOfWorksheets = true;
4. ** Įveskite baltą stulpelį pradžioje**
Tam tikriems duomenų importo scenarijams galite norėti pridėti balto stulpelio kaip pirmąjį stulpą:
options.InsertBlankColumnAtFirst = true;
Geriausios praktikos ir patarimai
- Iš anksto matyti išeitį, kad patikrintumėte lentelės išdėstymą ir duomenų vientisumą, ypač naudojant pažangias apdailos galimybes.
- Dideliems dokumentams naudokite batch apdorojimą, kad daugiafunkcinis konvertavimas būtų efektyvus.
- Konvertuojant į CSV, patikrinkite delimiterius ir kodavimą žemyn srauto suderinamumui.
- Dėl labai struktūrizuotų ar skenuojamų PDF dokumentų, išankstinio proceso dokumentai geriausiems rezultatams.
Išsamus įgyvendinimo pavyzdys
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Conclusion
Aspose.PDF XLS konverter .NET leidžia greitą, tvirtą ir lanksčią PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatizavimą C# projektuose. atverti duomenis iš PDF, sklandžios analizės ir integruoti plokštelės darbo srautus - visi su paprasta, aukštos kokybės API. Žiūrėti visą API nuorodą daugiau formato ir parinkčių detalių.
Dažnai užduodami klausimai
**Q: Kokius formatus galiu eksportuoti į XLSX?**A: Palaikomi formatai yra XLSX, XLSM, CSV, ODS ir Excel 2003 XML. Format
Nekilnojamojo turto pasirinkimas.
**Q: Kaip aš galiu išsaugoti visą PDF turinį į vieną darbo lapą?**Žyma: Set MinimizeTheNumberOfWorksheets = true
ant jūsų PdfToXlsOptions
.
**Q: Kur galiu rasti daugiau pavyzdžių ar gauti paramą?**A: Peržiūrėkite oficialią Aspose.PDF dokumentaciją, API nuorodą arba pažangių scenarijų kontaktinę paramą.