Hur man konverterar PDF till Excel (XLS / XLS / CSV) i .NET

Hur man konverterar PDF till Excel (XLS / XLS / CSV) i .NET

I den här artikeln visas hur man programmerat konverterar PDF-dokument till Microsoft Excel-format (XLS, XLSX, CSV, och mer) med Aspose.PDFXLS Converter för .NET. Detta gör att du kan låsa upp, analysera och automatisera dataöverföring från PDFs till skivor för vidare bearbetning, rapportering eller arkivering.

Realvärldsproblem

Exportera tabeller eller strukturerade data från PDF-filer till Excel manuellt är arbetsintens och felfria. Automatisering av denna omvandling är viktig för arbetsflöden i finansiering, rapportering, analys och överensstämmelse där bulk-PDF-to-spreadheet-operationer behövs.

Översikt över lösningen

Aspose.PDF XLS Converter för .NET låter dig:

  • Konvertera en eller flera PDF-filer till Excel (XLSX, XLS, CSV, ODS, XML)
  • Kontroll worksheet struktur och formatering
  • Integrera smidigt med C#/NET-projekt för skalbar automatisering

förutsättningar

  • Visual Studio 2019 eller senare
  • .NET 6.0 eller senare
  • Aspose.PDF för .NET installerat via NuGet
PM> Install-Package Aspose.PDF

Steg för steg genomförande

Steg 1: Referens Nödvändiga Namnutrymmen

using Aspose.Pdf.Plugins;
using System.IO;

Steg 2: Konvertera en PDF till XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Använd Cases & Applications (med kodvariationer)

1. Export till CSV, XLS, ODS eller XML

Ange önskad utgångsformat med hjälp av Format och fastighet:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat för alla stödda format.

2. Batch Konvertera flera PDF-filer till Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimera antalet arbetsblad

Som standard blir varje PDF-sida en ny Excel-arbetsbok. För att spara allt innehåll i en enda arbetsbok:

options.MinimizeTheNumberOfWorksheets = true;

4. Ange en vit kolumn vid start

För vissa dataimport scenarier kanske du vill lägga till en vit kolumn som den första kolumnen:

options.InsertBlankColumnAtFirst = true;

Bästa metoder och tips

  • Förhandsvisning av utgången för att verifiera tabelllagring och dataintegritet, särskilt när du använder avancerade layoutalternativ.
  • För stora dokument använder du batchbehandling för att automatisera bulkkonvertering effektivt.
  • När du konverterar till CSV, verifiera delimitörer och kodning för downstream kompatibilitet.
  • För mycket strukturerade eller skannade PDF-dokument för bästa resultat.

Exempel på fullständig genomförande

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

slutsatser

Aspose.PDF XLS Converter för .NET möjliggör snabb, robust och flexibel PDF-to-Excel automatisering (XLS / XLSX / CSV / XML / ODS) i C#-projekt. Låsa upp data från PDFs, strömlinjeanalyser och integrera arbetsflöden - alla med en enkel, högpresterande API. Se den fullständiga API-referensen för mer format och alternativ detaljer.

Ofta ställda frågor

**Q: Vilka format kan jag exportera till förutom XLSX?**A: Stödda format inkluderar XLSX, XLSM, CSV, ODS och Excel 2003 XML. Format Fastighet att välja.

**Q: Hur kan jag spara allt PDF-innehåll i en enda arbetsbok?**A: Sätt MinimizeTheNumberOfWorksheets = true På din PdfToXlsOptions.

**Q: Var kan jag hitta fler exempel eller få stöd?**A: Se den officiella Aspose.PDF-dokumentationen, API-referensen eller kontaktsupporten för avancerade scenarier.

 Svenska