Как да конвертирате PDF в Excel (XLS / XLSX / CSV) в .NET

Как да конвертирате PDF в Excel (XLS / XLSX / CSV) в .NET

Тази статия показва как да програматично конвертирате PDF документи в формати на Microsoft Excel (XLS, XLSX, CSV и др.) с помощта на Aspose.PDF XLS Converter за .NET. Това ви позволява да отключите, анализирате и автоматизирайте прехвърлянето на данни от PDF до шифрове за по-нататъшна обработка, докладване или архивиране.

Реални световни проблеми

Експортирането на таблици или структурирани данни от PDF до Excel ръчно е трудова интензивност и без грешки. Автоматизиране на тази конверсия е от жизненоважно значение за работните потоци в областта на финансите, докладите, анализите и съответствието, където са необходими масови PDF-на-прозрачни операции.

Преглед на решението

ASPOSE.PDF XLS Converter за .NET ви позволява:

  • Конвертирайте единични или множество PDF файлове в Excel (XLSX, XLS, CSV, ODS, XML)
  • Управление на структурата и форматирането на работния лист
  • Интегрирайте гладко с проекти на C#/NET за скалираща автоматизация

Предупреждения

  • Visual Studio 2019 или по-късно
  • .NET 6.0 или по-късно
  • Aspose.PDF за .NET, инсталиран чрез NuGet
PM> Install-Package Aspose.PDF

Стъпка по стъпка изпълнение

Стъпка 1: Предоставяне на необходимите имена

using Aspose.Pdf.Plugins;
using System.IO;

Стъпка 2: Конвертиране на PDF към XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Използване на случаи и приложения (с код вариации)

1. Износ към CSV, XLS, ODS или XML

Определете желания формат за изход, като използвате Format Имотът е:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelФормат за всички поддържани формати.

2. Batch конвертира няколко PDF файла в Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Намаляване на броя на работните карти

По подразбиране, всяка PDF страница се превръща в нов работен лист на Excel. За да се съхранява цялото съдържание в една работна листа:

options.MinimizeTheNumberOfWorksheets = true;

4. Вмъкнете бяла колона в началото

За определени сценарии за внос на данни, може да искате да добавите бял колона като първия:

options.InsertBlankColumnAtFirst = true;

Най-добри практики и съвети

  • Преглед на изхода, за да се провери расположението на таблицата и целостта на данните, особено при използване на усъвършенствани опции за расположение.
  • За големи документи, използвайте обработка на партиди, за да автоматизирате конвертирането на маси ефективно.
  • Когато конвертирате към CSV, проверете делимитерите и кодирането за съвместимост на потока надолу.
  • За високо структурирани или сканирани PDF документи, предварително обработени документи за най-добри резултати.

Допълнителен пример за изпълнение

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

заключение

Aspose.PDF XLS Converter за .NET позволява бързо, стабилно и гъвкаво автоматизиране на PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) в C# проекти. Отключване на данни от PDFs, анализ на редица линии и интегрирани работни потоци с шифрова лента - всички с проста, високопроизводителна API. Вижте пълната API референция за повече формати и опции.

Често задавани въпроси

**Q: Какви формати мога да експортирам в допълнение към XLSX?**A: Поддържаните формати включват XLSX, XLSM, CSV, ODS и Excel 2003 XML. Format Имотът трябва да бъде избран.

**П: Как мога да съхраня всички PDF съдържания в един работен лист?**A: Създаване MinimizeTheNumberOfWorksheets = true на Твоята PdfToXlsOptions.

Q: Къде мога да намеря повече примери или да получа подкрепа?A: Вижте официалната документация Aspose.PDF, API Референт или контактна поддръжка за напреднали сценарии.

 Български