Як перетворити PDF на Excel (XLS / XLS / CSV) в .NET

Як перетворити PDF на Excel (XLS / XLS / CSV) в .NET

Ця стаття показує, як програматично конвертувати PDF-документи в формати Microsoft Excel (XLS, XLSX, CSV, і багато іншого) за допомогою Aspose.PDF XLS Converter для .NET. Це дозволяє розблокувати, аналізувати і автоматично передавати дані з PDF на слайди для подальшого обробки, звітування або архівування.

Реальні проблеми світу

Експортувати таблиці або структуровані дані з PDF до Excel вручну є робочою інтенсивністю і без помилок. Автоматизація цієї конверсії є життєво важливою для робочих потоків у фінансах, звітах, аналізі та відповідності, де потрібні великі операції в форматі PDF-на-розповсюдження.

Огляд рішення

ASPOSE.PDF XLS Converter для .NET дозволяє:

  • Конвертувати одноразові або кілька PDF-файлів в Excel (XLSX, XLS, CSV, ODS, XML)
  • Контроль структури та форматування робочого листа
  • Інтеграція з проектами C#/NET для скальованої автоматизації

Передумови

  • Visual Studio 2019 або вище
  • .NET 6.0 або пізніше
  • Aspose.PDF для .NET встановлено через NuGet
PM> Install-Package Aspose.PDF

Крок за кроком реалізація

Крок 1: Потрібні номінаційні простіри

using Aspose.Pdf.Plugins;
using System.IO;

Крок 2: Конвертувати PDF на XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Використання випадків і додатків (з варіантами коду)

1. Експорт до CSV, XLS, ODS або XML

Визначити бажаний формат виходу за допомогою Format Нерухомість :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelФормат для всіх підтримуваних форматів.

2. Batch Convert Multiple PDFs to Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Мінімальна кількість робочих сторінок

За замовчуванням, кожна сторінка PDF стає новою робочою таблицею Excel. Щоб зберегти весь вміст в одній робочій таблиці:

options.MinimizeTheNumberOfWorksheets = true;

4. Введіть білий стовп на початку

Для певних сценаріїв імпорту даних, можливо, ви хочете додати вільну колонку як першу:

options.InsertBlankColumnAtFirst = true;

Найкращі практики та поради

  • Переглянути вихід для перевірки табличного розташування та цілісності даних, особливо при використанні передових варіантів розташення.
  • Для великих документів використовуйте обробку пакетів для автоматизації масової конверсії ефективно.
  • При конвертації в CSV перевіряйте розмежування і кодування для співвідношення з низьким потоком.
  • Для високо структурованих або сканованих ПДФ, допроцесуальні документи для кращих результатів.

Повний приклад реалізації

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Заключення

ASPOSE.PDF XLS Converter для .NET дозволяє швидку, міцну і гнучку автоматизацію PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) в проектах C#. Відключити дані з PDF, аналітику рішучості та інтегрувати робочі потоки ширини — все з простим, високопродуктивним API.

Часто задавані запитання

**Q: Які формати я можу експортувати, крім XLSX?**Відповідь: Підтримувані формати включають XLSX, XLSM, CSV, ODS і Excel 2003 XML. Format Нерухомість для вибору.

**Q: Як я можу зберегти весь контент PDF в одній робочій листі?**А: Стіл MinimizeTheNumberOfWorksheets = true На твоїй PdfToXlsOptions.

**Q: Де я можу знайти більше прикладів або отримати підтримку?**Відповідь: Перегляньте офіційну документацію Aspose.PDF, API Reference або контактну підтримку для передових сценаріїв.

 Українська