Как да конвертирате PDF в Excel (XLS / XLSX / CSV) в .NET
Тази статия показва как да програматично конвертирате PDF документи в формати на Microsoft Excel (XLS, XLSX, CSV и др.) с помощта на Aspose.PDF XLS Converter за .NET. Това ви позволява да отключите, анализирате и автоматизирайте прехвърлянето на данни от PDF до шифрове за по-нататъшна обработка, докладване или архивиране.
Реални световни проблеми
Експортирането на таблици или структурирани данни от PDF до Excel ръчно е трудова интензивност и без грешки. Автоматизиране на тази конверсия е от жизненоважно значение за работните потоци в областта на финансите, докладите, анализите и съответствието, където са необходими масови PDF-на-прозрачни операции.
Преглед на решението
ASPOSE.PDF XLS Converter за .NET ви позволява:
- Конвертирайте единични или множество PDF файлове в Excel (XLSX, XLS, CSV, ODS, XML)
- Управление на структурата и форматирането на работния лист
- Интегрирайте гладко с проекти на C#/NET за скалираща автоматизация
Предупреждения
- Visual Studio 2019 или по-късно
- .NET 6.0 или по-късно
- Aspose.PDF за .NET, инсталиран чрез NuGet
PM> Install-Package Aspose.PDF
Стъпка по стъпка изпълнение
Стъпка 1: Предоставяне на необходимите имена
using Aspose.Pdf.Plugins;
using System.IO;
Стъпка 2: Конвертиране на PDF към XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Използване на случаи и приложения (с код вариации)
1. Износ към CSV, XLS, ODS или XML
Определете желания формат за изход, като използвате Format
Имотът е:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelФормат за всички поддържани формати.
2. Batch конвертира няколко PDF файла в Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Намаляване на броя на работните карти
По подразбиране, всяка PDF страница се превръща в нов работен лист на Excel. За да се съхранява цялото съдържание в една работна листа:
options.MinimizeTheNumberOfWorksheets = true;
4. Вмъкнете бяла колона в началото
За определени сценарии за внос на данни, може да искате да добавите бял колона като първия:
options.InsertBlankColumnAtFirst = true;
Най-добри практики и съвети
- Преглед на изхода, за да се провери расположението на таблицата и целостта на данните, особено при използване на усъвършенствани опции за расположение.
- За големи документи, използвайте обработка на партиди, за да автоматизирате конвертирането на маси ефективно.
- Когато конвертирате към CSV, проверете делимитерите и кодирането за съвместимост на потока надолу.
- За високо структурирани или сканирани PDF документи, предварително обработени документи за най-добри резултати.
Допълнителен пример за изпълнение
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
заключение
Aspose.PDF XLS Converter за .NET позволява бързо, стабилно и гъвкаво автоматизиране на PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) в C# проекти. Отключване на данни от PDFs, анализ на редица линии и интегрирани работни потоци с шифрова лента - всички с проста, високопроизводителна API. Вижте пълната API референция за повече формати и опции.
Често задавани въпроси
**Q: Какви формати мога да експортирам в допълнение към XLSX?**A: Поддържаните формати включват XLSX, XLSM, CSV, ODS и Excel 2003 XML. Format
Имотът трябва да бъде избран.
**П: Как мога да съхраня всички PDF съдържания в един работен лист?**A: Създаване MinimizeTheNumberOfWorksheets = true
на Твоята PdfToXlsOptions
.
Q: Къде мога да намеря повече примери или да получа подкрепа?A: Вижте официалната документация Aspose.PDF, API Референт или контактна поддръжка за напреднали сценарии.