Kā konvertēt PDF uz Excel (XLS / XLSX / CSV) .NET

Kā konvertēt PDF uz Excel (XLS / XLSX / CSV) .NET

Šajā rakstā ir parādīts, kā programmatiski konvertēt PDF dokumentus Microsoft Excel formātos (XLS, XLSX, CSV, un vairāk) izmantojot Aspose.PDF XLS Converter .NET. Tas ļauj atslēgt, analizēt un automātiski pārsūtīt datus no PDF failām uz skalošanas lapas tālākai apstrādei, ziņošanai vai arhivēšanai.

Reālā pasaules problēma

Eksportēt tabulas vai strukturētus datus no PDF uz Excel manuāli ir darba intensīva un kļūdaino. automātisko šo konversiju ir būtiski darba plūsmas finanšu, ziņošanas, analīzes un atbilstības jomā, kur ir nepieciešamas vairumtirdzniecības PDF-to-preadsheet operācijas.

Risinājumu pārskats

Aspose.PDF XLS Converter for .NET ļauj:

  • Konvertēt vienu vai vairāku PDF failus uz Excel failiem (XLSX, XLS, CSV, ODS, XML)
  • Kontroles darba lapu struktūra un formatēšana
  • Vienkārši integrējieties ar C#/NET projektiem, lai automātiski izplatītu

Prerequisites

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks
  • Aspose.PDF for .NET instalēts caur NuGet
PM> Install-Package Aspose.PDF

Step-by-step īstenošana

1. posms: References nepieciešamie nosaukuma telpas

using Aspose.Pdf.Plugins;
using System.IO;

2. solis: Konvertēt PDF uz XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Lietošanas gadījumi un pieteikumi (ar kodu izmaiņām)

1. Exports uz CSV, XLS, ODS vai XML

Nosakiet vēlamo iznākuma formātu, izmantojot Format Nekustamā īpašuma:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelFormat visiem atbalstītajiem formātiem.

2. Batch Konvertēt Multiple PDF uz Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. ** Minimāli darba lapu skaits**

Parasti katra PDF lapa kļūst par jaunu Excel darba lapu, lai saglabātu visu saturu vienā darba lapā:

options.MinimizeTheNumberOfWorksheets = true;

4. ** Ievadiet balto kolonu sākumā**

Attiecībā uz dažiem datu importēšanas scenārijiem, iespējams, vēlaties pievienot baltu slāni kā pirmo slāni:

options.InsertBlankColumnAtFirst = true;

Labākās prakses un padomi

  • Pārskatiet iznākumu, lai pārbaudītu tabulas izkārtojumu un datu integritāti, it īpaši, ja izmantojat uzlabotas izstādes iespējas.
  • Lieliem dokumentiem izmantojiet batch apstrādi, lai efektīvi automatizētu masu konversiju.
  • Konvertējot uz CSV, pārbaudiet izslēgšanas un kodēšanu, lai nodrošinātu lejupslīdes saderību.
  • Augsti strukturētiem vai skenētajiem PDF dokumentiem, pre-procesu dokumenti par labākajiem rezultātiem.

Pilnīgs īstenošanas piemērs

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusion

Aspose.PDF XLS Converter for .NET nodrošina ātru, spēcīgu un elastīgu PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) automatizāciju C# projektos. atbloķēt datus no PDF, streamline analīzes un integrēt paplašinātās lapas darba plūsmas - visi ar vienkāršu, augstas veiktspējas API.

Bieži uzdotie jautājumi

**Q: Kādus formātus es varu eksportēt uz papildus XLSX?**A: atbalstītie formāti ietver XLSX, XLSM, CSV, ODS un Excel 2003 XML. Format Nekustamā īpašuma izvēle.

**Q: Kā es varu saglabāt visu PDF saturu vienā darba lapā?**A: Sēde MinimizeTheNumberOfWorksheets = true Uz jūsu PdfToXlsOptions.

**Q: Kur varu atrast vairāk piemēru vai saņemt atbalstu?**A: Skatīt oficiālo Aspose.PDF dokumentāciju, API atsauci vai kontaktpapīru uzlabotajiem scenārijiem.

 Latviski