Hvordan til at konvertere PDF til Excel (XLS / XLSX / CSV) i .NET

Hvordan til at konvertere PDF til Excel (XLS / XLSX / CSV) i .NET

Denne artikel viser, hvordan man programmeret konverterer PDF-dokumenter til Microsoft Excel-formater (XLS, XLSX, CSV, og mere) ved hjælp af Aspose.PDF XLS Converter for .NET. Dette giver dig mulighed for at afslutte, analysere og automatisere dataoverførsel fra PDF’er i spreadsheets for yderligere behandling, rapportering eller arkivering.

Det virkelige problem

Eksport af tabeller eller strukturerede data fra PDF’er til Excel manuelt er arbejdsintens og fejlfrit. Automatisering af denne konvertering er afgørende for arbejdsprocesser i finansiering, rapportering, analyse og overholdelse, hvor massive PDF-til-spredskabsoperationer er nødvendige.

Oversigt over løsning

Aspose.PDF XLS Converter for .NET giver dig mulighed for:

  • Konverter enkelt eller flere PDF’er til Excel-filer (XLSX, XLS, CSV, ODS, XML)
  • Styring af værktøjskonstruktion og formatering
  • Integration med C#/NET-projekter for skalerbar automatisering

Forudsætninger

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller senere
  • Aspose.PDF for .NET installeret via NuGet
PM> Install-Package Aspose.PDF

Step-by-Step gennemførelse

Trin 1: Reference krævede navneområder

using Aspose.Pdf.Plugins;
using System.IO;

Trin 2: Konverter en PDF til XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Brug af tilfælde og applikationer (med kodvariationer)

1. ** Eksport til CSV, XLS, ODS eller XML**

Angiv det ønskede udgangsformat ved hjælp af Format Ejendommen er:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat for alle understøttede formater.

2. Batch konverterer flere PDF’er til Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. * Minimere antallet af arbejdspladser*

Som standard bliver hver PDF-side til en ny Excel-arbejdsblade. for at gemme alt indhold i en enkelt arbejdsbok:

options.MinimizeTheNumberOfWorksheets = true;

4. ** Angiv en hvid kolonne ved start**

For visse dataimport-scenarier vil du muligvis tilføje en hvid kolonne som den første kolumn:

options.InsertBlankColumnAtFirst = true;

Bedste praksis og tips

  • Forhåndsvisning udgang for at verificere tabellarrangement og data integritet, især når du bruger avancerede layout muligheder.
  • For store dokumenter bruger du batchbehandling til at automatisere massekonvertering effektivt.
  • Når du konverterer til CSV, verificerer du delimitere og koder for downstream kompatibilitet.
  • For meget strukturerede eller scannede PDF’er, forudprocessdokumenter for de bedste resultater.

Eksempel på fuld gennemførelse

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Konklusion

Aspose.PDF XLS Converter for .NET muliggør hurtig, robust og fleksibel PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatisering i C# projekter. Unlock data fra PDF’er, streamline analytics, og integrere spreadsheet arbejdsprocesser - alle med en simpel, høj ydeevne API. Se den fulde API Reference for mere format og mulighed detaljer.

Ofte stillede spørgsmål

**Q: Hvilke formater kan jeg eksportere til ud over XLSX?**A: Støttet format omfatter XLSX, XLSM, CSV, ODS og Excel 2003 XML. Format Ejendomme til at vælge.

**Q: Hvordan kan jeg gemme alle PDF-indholdene i et enkelt worksheet?**A: Set af MinimizeTheNumberOfWorksheets = true På din PdfToXlsOptions.

**Q: Hvor kan jeg finde flere eksempler eller få support?**A: Se den officielle Aspose.PDF-dokumentation, API Reference eller kontaktstøtte for avancerede scenarier.

 Dansk