Jak przekonwertować plik PDF do programu Excel (XLS / XLSX / CSV) w .NET

Jak przekonwertować plik PDF do programu Excel (XLS / XLSX / CSV) w .NET

W tym artykule przedstawiono, jak programowo konwertować dokumenty PDF do formatów programu Microsoft Excel (XLS, XLSX, CSV i więcej) za pomocą Konwertera Aspose.PDF dla .NET. To umożliwia odblokowanie, analizę i automatyczne przesyłanie danych z plików PDF na arkusze dla dalszego przetwarzania, raportowania lub archiwizacji.

Problem świata rzeczywistego

Eksportowanie tabel lub strukturowanych danych z plików PDF do programu Excel ręcznie jest intensywne i błędne. automatyzacja tej konwersji jest niezbędna dla przepływów roboczych w dziedzinie finansowania, sprawozdawczości, analizy i zgodności, w których wymagane są masowe operacje pliku PDF-to-spreadsheet.

Przegląd rozwiązania

Aspose.PDF XLS Converter dla .NET pozwala na:

  • Konwertuj pojedyncze lub wielokrotne pliki PDF do plików Excel (XLSX, XLS, CSV, ODS, XML)
  • Kontrola struktury tablicy roboczej i formatowania
  • Łatwa integracja z projektami C#/NET dla automatyzacji skalowalnej

Warunki

  • Visual Studio 2019 lub później
  • .NET 6.0 lub nowszy
  • Aspose.PDF dla .NET zainstalowany za pośrednictwem NuGet
PM> Install-Package Aspose.PDF

Wdrażanie krok po kroku

Krok 1: Wymagane przestrzenie nazwowe

using Aspose.Pdf.Plugins;
using System.IO;

Krok 2: Konwersja pliku PDF do XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Używanie przypadków i aplikacji (z odmianami kodu)

1. Eksport do CSV, XLS, ODS lub XML

określenie pożądanego formatu wyjścia za pomocą Format Właściwości :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat dla wszystkich obsługiwanych formatów.

2. Batch Konwertuj Wiele plików PDF do programu Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimalizacja liczby płyt roboczych

Wstępnie każda strona PDF staje się nową kartą roboczą programu Excel. Aby zapisać całą zawartość w jednym arkuszu roboczym:

options.MinimizeTheNumberOfWorksheets = true;

4. Wprowadź białą kolumnę na starcie

W przypadku niektórych scenariuszy importu danych możesz dodać białą kolumnę jako pierwszą:

options.InsertBlankColumnAtFirst = true;

Najlepsze praktyki i wskazówki

  • Przegląd wyjścia, aby sprawdzić rozkład tabeli i integralność danych, zwłaszcza przy użyciu zaawansowanych opcji rozłożenia.
  • W przypadku dużych dokumentów, użyj przetwarzania pakietów do automatyzacji konwersji masowej w sposób efektywny.
  • Podczas konwersji do CSV sprawdź delimiters i kodowanie dla kompatybilności downstream.
  • Dla wysoce zorganizowanych lub skanowanych plików PDF, dokumenty pre-procesowe dla najlepszych wyników.

Pełny przykład wdrażania

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

konkluzja

Aspose.PDF XLS Converter dla .NET umożliwia szybką, wytrzymałą i elastyczną automatyzację PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) w projektach C#. Odblokuj dane z PDF, analizę prędkości i integruj przepływy robocze płyty - wszystkie z prostym, wysokiej wydajności API.

Często zadawane pytania

**Q: Jakie formaty mogę eksportować poza XLSX?**Odpowiedź: Wspierane formaty obejmują XLSX, XLSM, CSV, ODS i Excel 2003 XML. Format Właściwości do wyboru.

**Q: Jak mogę przechowywać całą zawartość PDF w jednym arkuszu roboczym?**A: Zestaw MinimizeTheNumberOfWorksheets = true Na Twoją PdfToXlsOptions.

**Q: Gdzie mogę znaleźć więcej przykładów lub uzyskać wsparcie?**Odpowiedź: Zobacz oficjalną dokumentację Aspose.PDF, referencję API lub wsparcie kontaktowe dla zaawansowanych scenariuszy.

 Polski