Як перетворити PDF на Excel (XLS / XLS / CSV) в .NET
Ця стаття показує, як програматично конвертувати PDF-документи в формати Microsoft Excel (XLS, XLSX, CSV, і багато іншого) за допомогою Aspose.PDF XLS Converter для .NET. Це дозволяє розблокувати, аналізувати і автоматично передавати дані з PDF на слайди для подальшого обробки, звітування або архівування.
Реальні проблеми світу
Експортувати таблиці або структуровані дані з PDF до Excel вручну є робочою інтенсивністю і без помилок. Автоматизація цієї конверсії є життєво важливою для робочих потоків у фінансах, звітах, аналізі та відповідності, де потрібні великі операції в форматі PDF-на-розповсюдження.
Огляд рішення
ASPOSE.PDF XLS Converter для .NET дозволяє:
- Конвертувати одноразові або кілька PDF-файлів в Excel (XLSX, XLS, CSV, ODS, XML)
- Контроль структури та форматування робочого листа
- Інтеграція з проектами C#/NET для скальованої автоматизації
Передумови
- Visual Studio 2019 або вище
- .NET 6.0 або пізніше
- Aspose.PDF для .NET встановлено через NuGet
PM> Install-Package Aspose.PDF
Крок за кроком реалізація
Крок 1: Потрібні номінаційні простіри
using Aspose.Pdf.Plugins;
using System.IO;
Крок 2: Конвертувати PDF на XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Використання випадків і додатків (з варіантами коду)
1. Експорт до CSV, XLS, ODS або XML
Визначити бажаний формат виходу за допомогою Format
Нерухомість :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelФормат для всіх підтримуваних форматів.
2. Batch Convert Multiple PDFs to Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Мінімальна кількість робочих сторінок
За замовчуванням, кожна сторінка PDF стає новою робочою таблицею Excel. Щоб зберегти весь вміст в одній робочій таблиці:
options.MinimizeTheNumberOfWorksheets = true;
4. Введіть білий стовп на початку
Для певних сценаріїв імпорту даних, можливо, ви хочете додати вільну колонку як першу:
options.InsertBlankColumnAtFirst = true;
Найкращі практики та поради
- Переглянути вихід для перевірки табличного розташування та цілісності даних, особливо при використанні передових варіантів розташення.
- Для великих документів використовуйте обробку пакетів для автоматизації масової конверсії ефективно.
- При конвертації в CSV перевіряйте розмежування і кодування для співвідношення з низьким потоком.
- Для високо структурованих або сканованих ПДФ, допроцесуальні документи для кращих результатів.
Повний приклад реалізації
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Заключення
ASPOSE.PDF XLS Converter для .NET дозволяє швидку, міцну і гнучку автоматизацію PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) в проектах C#. Відключити дані з PDF, аналітику рішучості та інтегрувати робочі потоки ширини — все з простим, високопродуктивним API.
Часто задавані запитання
**Q: Які формати я можу експортувати, крім XLSX?**Відповідь: Підтримувані формати включають XLSX, XLSM, CSV, ODS і Excel 2003 XML. Format
Нерухомість для вибору.
**Q: Як я можу зберегти весь контент PDF в одній робочій листі?**А: Стіл MinimizeTheNumberOfWorksheets = true
На твоїй PdfToXlsOptions
.
**Q: Де я можу знайти більше прикладів або отримати підтримку?**Відповідь: Перегляньте офіційну документацію Aspose.PDF, API Reference або контактну підтримку для передових сценаріїв.