Kaip konvertuoti PDF į Excel (XLS / XLSX / CSV) į .NET

Kaip konvertuoti PDF į Excel (XLS / XLSX / CSV) į .NET

Šiame straipsnyje parodyta, kaip programuojamai konvertuoti PDF dokumentus į „Microsoft Excel“ formatus (XLS, XLSX, CSV ir kt.) naudojant „Aspose.PDF XL S Converter“ .NET. Tai leidžia atverti, analizuoti ir automatiškai perkelti duomenis iš PDF į plokšteles tolesniam apdorojimui, ataskaitų teikimui ar archyvavimui.

Realaus pasaulio problemos

Eksportuoti lenteles ar struktūrizuotus duomenis iš PDF į Excel rankiniu būdu yra intensyvus darbas ir klaidų priežastis. Automatizuoti šią konvertavimą yra labai svarbu darbo srautams finansuose, ataskaitose, analizėje ir atitikties srityse, kuriose reikalingos didelės apimties PDF-to-preadsheet operacijos.

Sprendimo apžvalga

Aspose.PDF XLS Converter for .NET leidžia jums:

  • Vieno ar kelių PDF failų konvertavimas į Excel failus (XLSX, XLS, CSV, ODS, XML)
  • Kontrolės darbalaukio struktūra ir formatavimas
  • Lengvai integruokite su C#/NET projektais, kad galėtumėte skalauti automatizavimą

Prerequisites

  • „Visual Studio 2019“ arba vėliau
  • .NET 6.0 arba naujesnė
  • Aspose.PDF už .NET įdiegtas per NuGet
PM> Install-Package Aspose.PDF

Žingsnis po žingsnio įgyvendinimas

1 žingsnis: Reikalingos pavadinimų erdvės

using Aspose.Pdf.Plugins;
using System.IO;

2 žingsnis: konvertuoti PDF į XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Naudokite atvejus ir paraiškas (su kodo variacijomis)

1. Exportuoti į CSV, XLS, ODS arba XML

Nustatykite pageidaujamą išleidimo formatą naudojant Format Nekilnojamojo turto:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormatas Visi remiami formatai.

2. Batch konvertuoti daug PDF į Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. * Minimalizuokite darbų skaičių*

Pavyzdžiui, kiekvienas PDF puslapis tampa nauju „Excel“ darbalauku. norint išsaugoti visą turinį viename darbale:

options.MinimizeTheNumberOfWorksheets = true;

4. ** Įveskite baltą stulpelį pradžioje**

Tam tikriems duomenų importo scenarijams galite norėti pridėti balto stulpelio kaip pirmąjį stulpą:

options.InsertBlankColumnAtFirst = true;

Geriausios praktikos ir patarimai

  • Iš anksto matyti išeitį, kad patikrintumėte lentelės išdėstymą ir duomenų vientisumą, ypač naudojant pažangias apdailos galimybes.
  • Dideliems dokumentams naudokite batch apdorojimą, kad daugiafunkcinis konvertavimas būtų efektyvus.
  • Konvertuojant į CSV, patikrinkite delimiterius ir kodavimą žemyn srauto suderinamumui.
  • Dėl labai struktūrizuotų ar skenuojamų PDF dokumentų, išankstinio proceso dokumentai geriausiems rezultatams.

Išsamus įgyvendinimo pavyzdys

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusion

Aspose.PDF XLS konverter .NET leidžia greitą, tvirtą ir lanksčią PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatizavimą C# projektuose. atverti duomenis iš PDF, sklandžios analizės ir integruoti plokštelės darbo srautus - visi su paprasta, aukštos kokybės API. Žiūrėti visą API nuorodą daugiau formato ir parinkčių detalių.

Dažnai užduodami klausimai

**Q: Kokius formatus galiu eksportuoti į XLSX?**A: Palaikomi formatai yra XLSX, XLSM, CSV, ODS ir Excel 2003 XML. Format Nekilnojamojo turto pasirinkimas.

**Q: Kaip aš galiu išsaugoti visą PDF turinį į vieną darbo lapą?**Žyma: Set MinimizeTheNumberOfWorksheets = true ant jūsų PdfToXlsOptions.

**Q: Kur galiu rasti daugiau pavyzdžių ar gauti paramą?**A: Peržiūrėkite oficialią Aspose.PDF dokumentaciją, API nuorodą arba pažangių scenarijų kontaktinę paramą.

 Lietuvių