Hur man konverterar PDF till Excel (XLS / XLS / CSV) i .NET

Hur man konverterar PDF till Excel (XLS / XLS / CSV) i .NET

Denna artikel visar hur man programmerar omvandling PDF dokument i Microsoft Excel-format (XLS, XLSX, CSV och mer) med Aspose.PDF XLS Konverter för .NET. Detta gör att du kan låsa upp, analysera och automatiskt överföra data från PDF-filer till skivor för vidare bearbetning, rapportering eller arkivering.

Realvärldsproblem

Exportera tabeller eller strukturerade data från PDF-filer till Excel manuellt är arbetsintens och felfria. Automatisering av denna omvandling är viktig för arbetsflöden i finansiering, rapportering, analys och överensstämmelse där bulk-PDF-to-spreadheet-operationer behövs.

Översikt över lösningen

Aspose.PDF XLS Converter för .NET låter dig:

  • Konvertera en eller flera PDF-filer till Excel (XLSX, XLS, CSV, ODS, XML)
  • Kontroll worksheet struktur och formatering
  • Integrera smidigt med C#/NET-projekt för skalbar automatisering

förutsättningar

  • Visual Studio 2019 eller senare
  • .NET 6.0 eller senare
  • Aspose.PDF för .NET installerat via NuGet
PM> Install-Package Aspose.PDF

Steg för steg genomförande

Steg 1: Referens Nödvändiga Namnutrymmen

using Aspose.Pdf.Plugins;
using System.IO;

Steg 2: Konvertera en PDF till XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Använd Cases & Applications (med kodvariationer)

1. Export till CSV, XLS, ODS eller XML

Ange önskad utgångsformat med hjälp av Format och fastighet:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat för alla stödda format.

2. Batch Konvertera flera PDF-filer till Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimera antalet arbetsblad

Som standard blir varje PDF-sida en ny Excel-arbetsbok. För att spara allt innehåll i en enda arbetsbok:

options.MinimizeTheNumberOfWorksheets = true;

4. Ange en vit kolumn vid start

För vissa dataimport scenarier kanske du vill lägga till en vit kolumn som den första kolumnen:

options.InsertBlankColumnAtFirst = true;

Bästa metoder och tips

  • Förhandsvisning av utgången för att verifiera tabelllagring och dataintegritet, särskilt när du använder avancerade layoutalternativ.
  • För stora dokument använder du batchbehandling för att automatisera bulkkonvertering effektivt.
  • När du konverterar till CSV, verifiera delimitörer och kodning för downstream kompatibilitet.
  • För mycket strukturerade eller skannade PDF-dokument för bästa resultat.

Exempel på fullständig genomförande

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

slutsatser

Aspose.PDF XLS Converter för .NET möjliggör snabb, robust och flexibel PDF-to-Excel automatisering (XLS / XLSX / CSV / XML / ODS) i C#-projekt. Låsa upp data från PDFs, strömlinjeanalyser och integrera arbetsflöden - alla med en enkel, högpresterande API. Se den fullständiga API-referensen för mer format och alternativ detaljer.

Ofta ställda frågor

**Q: Vilka format kan jag exportera till förutom XLSX?**A: Stödda format inkluderar XLSX, XLSM, CSV, ODS och Excel 2003 XML Format Fastighet att välja.

**Q: Hur kan jag spara allt PDF-innehåll i en enda arbetsbok?**A: Sätt MinimizeTheNumberOfWorksheets = true På din PdfToXlsOptions.

**Q: Var kan jag hitta fler exempel eller få stöd?**A: Se den officiella Aspose.PDF-dokumentationen, API-referensen eller kontaktsupporten för avancerade scenarier.

 Svenska