Kako pretvoriti PDF u Excel (XLS / XLSX / CSV) u .NET

Kako pretvoriti PDF u Excel (XLS / XLSX / CSV) u .NET

Ovaj članak prikazuje kako programski pretvoriti PDF dokumente u Microsoft Excel formate (XLS, XLSX, CSV, i više) pomoću Aspose.PDF XLS Converter za .NET. To vam omogućuje da otključite, analizirati i automatizirati prijenos podataka iz PDF-a u spreadsheets za daljnju obradu, izvješćivanje ili arhiviranje.

Real-svjetski problem

Izvoz tablica ili strukturiranih podataka iz PDF-a u Excel ručno je radno intenzivan i bez pogrešaka. Automatizacija ove konverzije ključna je za tokove rada u financijama, izvješćivanju, analizi i usklađenosti gdje su potrebne operacije u velikoj količini od PDF do brošure.

Pregled rješenja

Aspose.PDF XLS Converter za .NET omogućuje:

  • Konvertirati pojedinačne ili više PDF-a u Excel datoteke (XLSX, XLS, CSV, ODS, XML)
  • Kontrola strukture radnog lista i formatacije
  • Integrirajte se s C#/NET projektima za skalabilnu automatizaciju

Preduzeća

  • Visual Studio 2019 ili kasnije
  • .NET 6.0 ili noviji
  • Aspose.PDF za .NET instaliran preko NuGeta
PM> Install-Package Aspose.PDF

Korak po korak provedba

Korak 1: Potrebni nazivni prostori

using Aspose.Pdf.Plugins;
using System.IO;

Korak 2: Konvertirati PDF na XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Korištenje slučajeva i aplikacija (s varijacijama koda)

1. Izvoz na CSV, XLS, ODS ili XML

određivanje željene formate izlaska pomoću Format i nekretnine:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat Za sve podržane formate.

2. Batch pretvoriti više PDF-a u Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimizirajte broj radnih mjesta

Podrazumevano, svaka PDF stranica postaje novi Excel radni list. da biste sačuvali sve sadržaje u jednom radnom listu:

options.MinimizeTheNumberOfWorksheets = true;

4. Ustavite bijelu stolpcu na početku

Za određene scenarije uvoza podataka, možda želite dodati bijelu stolpcu kao prvu stolpec:

options.InsertBlankColumnAtFirst = true;

Najbolje prakse i savjeti

  • Predviđanje izlaska kako bi se provjerila raspored tablice i integritet podataka, osobito kada se koriste napredne mogućnosti rasporeda.
  • Za velike dokumente, koristite obradu paketa kako biste učinkovito automatizirali konverziju mase.
  • Prilikom pretvaranja u CSV, provjerite delimitere i kodiranje za kompatibilnost downstream.
  • Za visoko strukturirane ili skenirane PDF-ove, predprocesni dokumenti za najbolje rezultate.

Potpuni primjer provedbe

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

zaključak

Aspose.PDF XLS Converter za .NET omogućuje brzu, čvrstu i fleksibilnu automatizaciju PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) u C# projektima. otključivanje podataka iz PDF, analize struje i integriranje radnih tokova spreadsheet-sve s jednostavnim, visoke performanse API. pogledajte cijeli API Reference za više detalja formata i opcija.

Često postavljana pitanja

**Q: Koje formate mogu izvoziti osim XLSX-a?**A: Podržani formati uključuju XLSX, XLSM, CSV, ODS i Excel 2003 XML. Format Proizvodi za odabir.

**Q: Kako mogu sačuvati sve PDF sadržaje u jednom radnom listu?**A: Sastav MinimizeTheNumberOfWorksheets = true Na tvojoj PdfToXlsOptions.

**Q: Gdje mogu pronaći više primjera ili dobiti potporu?**Odgovor: Pogledajte službenu dokumentaciju Aspose.PDF, API Reference ili kontaktnu podršku za napredne scenarije.

 Hrvatski