Hvordan konvertere PDF til Excel (XLS / XLSX / CSV) i .NET

Hvordan konvertere PDF til Excel (XLS / XLSX / CSV) i .NET

Denne artikkelen viser hvordan du programmatisk konverterer PDF-dokumenter til Microsoft Excel-formater (XLS, XLSX, CSV, og mer) ved hjelp av Aspose.PDF XLS Converter for .NET. Dette gjør det mulig å unlock, analysere og automatisere dataoverføring fra PDFs til spreadsheets for videre behandling, rapportering, eller arkivering.

Real-verdens problem

Eksport av tabeller eller strukturerte data fra PDFs til Excel manuelt er arbeidsintens og feilfri. Automatisering av denne konverteringen er avgjørende for arbeidsflyter i finans, rapportering, analyse og overholdelse der massive PDF-til-spreadsheet-operasjoner er nødvendig.

Oversikt over løsning

Aspose.PDF XLS Converter for .NET lar deg:

  • Konverter enkelt eller flere PDF-er til Excel-filer (XLSX, XLS, CSV, ODS, XML)
  • Kontroller arbeidsblatt struktur og formatering
  • Integrere jevnt med C#/NET-prosjekter for skalerbar automatisering

Prerequisites

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller senere
  • Aspose.PDF for .NET installert via NuGet
PM> Install-Package Aspose.PDF

Step-by-step implementering

Steg 1: Referanse nødvendige navneområder

using Aspose.Pdf.Plugins;
using System.IO;

Trinn 2: Konverter en PDF til XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Bruk av tilfeller og applikasjoner (med kodevariasjoner)

1. ** Eksport til CSV, XLS, ODS eller XML**

Angi ønsket utgangsformat ved hjelp av Format Eiendommer :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat for alle støttet format.

2. Batch Convert Multiple PDFs til Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. *Minimum antall arbeidsplater

Som standard blir hver PDF-side en ny Excel-arbeidsbok. for å lagre alt innhold i en enkelt arbeidsbok:

options.MinimizeTheNumberOfWorksheets = true;

4. ** Angi en hvit kolonne ved start**

For visse dataimport scenarier vil du kanskje legge til en hvit kolonne som den første kolonnen:

options.InsertBlankColumnAtFirst = true;

Beste praksis og tips

  • Forhåndsvisning av utgang for å verifisere tabelloppsett og data integritet, spesielt når du bruker avanserte layoutalternativer.
  • For store dokumenter, bruk batchbehandling for å automatisere massekonvertering effektivt.
  • Når du konverterer til CSV, sjekk delimitere og koding for downstream kompatibilitet.
  • For svært strukturerte eller skannede PDF-er, forhåndsprosessdokumenter for beste resultater.

Komplett eksempler på implementering

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusion

Aspose.PDF XLS Converter for .NET muliggjør rask, robust og fleksibel PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatisering i C# prosjekter. Unlock data fra PDFs, streamline analytics, og integrere spreadsheet arbeidsflyter - alt med en enkel, høy ytelse API. Se den fullstendige API Referanse for mer format og valginformasjon.

Ofte stillede spørsmål

**Q: Hvilke formater kan jeg eksportere til i tillegg til XLSX?**A: Støttet format inkluderer XLSX, XLSM, CSV, ODS og Excel 2003 XML. Format Eiendom å velge.

**Q: Hvordan kan jeg lagre all PDF-innhold i et enkelt arbeidsblad?**A: sett MinimizeTheNumberOfWorksheets = true På din PdfToXlsOptions.

**Q: Hvor kan jeg finne flere eksempler eller få støtte?**A: Se den offisielle Aspose.PDF-dokumentasjonen, API-referansen eller kontaktstøtte for avanserte scenarier.

 Norsk