Kā konvertēt PDF uz Excel (XLS / XLSX / CSV) .NET
Šajā rakstā ir parādīts, kā programmatiski konvertēt PDF dokumentus Microsoft Excel formātos (XLS, XLSX, CSV, un vairāk) izmantojot Aspose.PDF XLS Converter .NET. Tas ļauj atslēgt, analizēt un automātiski pārsūtīt datus no PDF failām uz skalošanas lapas tālākai apstrādei, ziņošanai vai arhivēšanai.
Reālā pasaules problēma
Eksportēt tabulas vai strukturētus datus no PDF uz Excel manuāli ir darba intensīva un kļūdaino. automātisko šo konversiju ir būtiski darba plūsmas finanšu, ziņošanas, analīzes un atbilstības jomā, kur ir nepieciešamas vairumtirdzniecības PDF-to-preadsheet operācijas.
Risinājumu pārskats
Aspose.PDF XLS Converter for .NET ļauj:
- Konvertēt vienu vai vairāku PDF failus uz Excel failiem (XLSX, XLS, CSV, ODS, XML)
- Kontroles darba lapu struktūra un formatēšana
- Vienkārši integrējieties ar C#/NET projektiem, lai automātiski izplatītu
Prerequisites
- Visual Studio 2019 vai vēlāk
- .NET 6.0 vai jaunāks
- Aspose.PDF for .NET instalēts caur NuGet
PM> Install-Package Aspose.PDF
Step-by-step īstenošana
1. posms: References nepieciešamie nosaukuma telpas
using Aspose.Pdf.Plugins;
using System.IO;
2. solis: Konvertēt PDF uz XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Lietošanas gadījumi un pieteikumi (ar kodu izmaiņām)
1. Exports uz CSV, XLS, ODS vai XML
Nosakiet vēlamo iznākuma formātu, izmantojot Format
Nekustamā īpašuma:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat visiem atbalstītajiem formātiem.
2. Batch Konvertēt Multiple PDF uz Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. ** Minimāli darba lapu skaits**
Parasti katra PDF lapa kļūst par jaunu Excel darba lapu, lai saglabātu visu saturu vienā darba lapā:
options.MinimizeTheNumberOfWorksheets = true;
4. ** Ievadiet balto kolonu sākumā**
Attiecībā uz dažiem datu importēšanas scenārijiem, iespējams, vēlaties pievienot baltu slāni kā pirmo slāni:
options.InsertBlankColumnAtFirst = true;
Labākās prakses un padomi
- Pārskatiet iznākumu, lai pārbaudītu tabulas izkārtojumu un datu integritāti, it īpaši, ja izmantojat uzlabotas izstādes iespējas.
- Lieliem dokumentiem izmantojiet batch apstrādi, lai efektīvi automatizētu masu konversiju.
- Konvertējot uz CSV, pārbaudiet izslēgšanas un kodēšanu, lai nodrošinātu lejupslīdes saderību.
- Augsti strukturētiem vai skenētajiem PDF dokumentiem, pre-procesu dokumenti par labākajiem rezultātiem.
Pilnīgs īstenošanas piemērs
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Conclusion
Aspose.PDF XLS Converter for .NET nodrošina ātru, spēcīgu un elastīgu PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatizāciju C# projektos. atbloķēt datus no PDF, streamline analīzes un integrēt paplašinātās lapas darba plūsmas - visi ar vienkāršu, augstas veiktspējas API.
Bieži uzdotie jautājumi
**Q: Kādus formātus es varu eksportēt uz papildus XLSX?**A: atbalstītie formāti ietver XLSX, XLSM, CSV, ODS un Excel 2003 XML. Format
Nekustamā īpašuma izvēle.
**Q: Kā es varu saglabāt visu PDF saturu vienā darba lapā?**A: Sēde MinimizeTheNumberOfWorksheets = true
Uz jūsu PdfToXlsOptions
.
**Q: Kur varu atrast vairāk piemēru vai saņemt atbalstu?**A: Skatīt oficiālo Aspose.PDF dokumentāciju, API atsauci vai kontaktpapīru uzlabotajiem scenārijiem.