Hvordan konvertere PDF til Excel (XLS / XLSX / CSV) i .NET

Hvordan konvertere PDF til Excel (XLS / XLSX / CSV) i .NET

Denne artikkelen viser hvordan å programmatisk konvertere PDF dokumenter i Microsoft Excel-format (XLS, XLSX, CSV, og mer) ved hjelp av Aspose.PDF XLS Converter for .NET. Dette gjør at du kan låse opp, analysere og automatisere dataoverføring fra PDFs til spreadsheets for videre behandling, rapportering eller arkivering.

Real-verdens problem

Eksport av tabeller eller strukturerte data fra PDFs til Excel manuelt er arbeidsintens og feilfri. Automatisering av denne konverteringen er avgjørende for arbeidsflyter i finans, rapportering, analyse og overholdelse der massive PDF-til-spreadsheet-operasjoner er nødvendig.

Oversikt over løsning

Aspose.PDF XLS Converter for .NET lar deg:

  • Konverter enkelt eller flere PDF-er til Excel-filer (XLSX, XLS, CSV, ODS, XML)
  • Kontroller arbeidsblatt struktur og formatering
  • Integrere jevnt med C#/NET-prosjekter for skalerbar automatisering

Prerequisites

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller senere
  • Aspose.PDF for .NET installert via NuGet
PM> Install-Package Aspose.PDF

Step-by-step implementering

Steg 1: Referanse nødvendige navneområder

using Aspose.Pdf.Plugins;
using System.IO;

Trinn 2: Konverter en PDF til XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Bruk av tilfeller og applikasjoner (med kodevariasjoner)

1. Eksport til CSV, XLS, ODS eller XML

Angi ønsket utgangsformat ved hjelp av Format Eiendommer:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat for alle støttet format.

2. Batch Convert Multiple PDFs til Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimum antall arbeidsplater

Som standard blir hver PDF-side en ny Excel-arbeidsbok. for å lagre alt innhold i en enkelt arbeidsbok:

options.MinimizeTheNumberOfWorksheets = true;

4. Angi en hvit kolonne ved start

For visse dataimport scenarier vil du kanskje legge til en hvit kolonne som den første kolonnen:

options.InsertBlankColumnAtFirst = true;

Beste praksis og tips

  • Forhåndsvisning av utgang for å verifisere tabelloppsett og data integritet, spesielt når du bruker avanserte layoutalternativer.
  • For store dokumenter, bruk batchbehandling for å automatisere massekonvertering effektivt.
  • Når du konverterer til CSV, sjekk delimitere og koding for downstream kompatibilitet.
  • For svært strukturerte eller skannede PDF-er, forhåndsprosessdokumenter for beste resultater.

Komplett eksempler på implementering

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusion

Aspose.PDF XLS Converter for .NET muliggjør rask, robust og fleksibel PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatisering i C# prosjekter. Unlock data fra PDFs, streamline analytics, og integrere spreadsheet arbeidsflyter - alt med en enkel, høy ytelse API. Se den fullstendige API Referanse for mer format og valginformasjon.

Ofte stillede spørsmål

**Q: Hvilke formater kan jeg eksportere til i tillegg til XLSX?**A: Støttet format inkluderer XLSX, XLSM, CSV, ODS og Excel 2003 XML Format Eiendom å velge.

**Q: Hvordan kan jeg lagre all PDF-innhold i et enkelt arbeidsblad?**A: sett MinimizeTheNumberOfWorksheets = true På din PdfToXlsOptions.

**Q: Hvor kan jeg finne flere eksempler eller få støtte?**A: Se den offisielle Aspose.PDF-dokumentasjonen, API-referansen eller kontaktstøtte for avanserte scenarier.

 Norsk