Miten muuntaa PDF Excel (XLS / XLSX / CSV) .NET

Miten muuntaa PDF Excel (XLS / XLSX / CSV) .NET

Tässä artikkelissa esitetään, miten ohjelmattisesti muuntaa PDF-tiedostoja Microsoft Excel-muodossa (XLS, XLSX, CSV, ja enemmän) käyttämällä Aspose.PDF XLS Converter for .NET. Tämä mahdollistaa lukitsemisen, analysoinnin ja automaattisen tiedonsiirron PDF: stä levylle jatkossakin käsittelyä, raportointia tai arkistointia varten.

Reaalimaailman ongelma

Taulukkojen tai rakenteellisten tietojen vienti PDF-tiedostosta Excelille manuaalisesti on työvoimaa ja virheitä. Tämän muuntamisen automatisointi on välttämätöntä rahoitus-, raportointi-, analyysi- ja vaatimustenmukaisuuden työvälineille, joissa tarvitaan runsaasti PDF: n ja levytarkkinatoimintaa.

Ratkaisun yleiskatsaus

Aspose.PDF XLS Converter for .NET antaa sinulle mahdollisuuden:

  • Muunna yksittäiset tai useat PDF-tiedostot Excelin tiedostoihin (XLSX, XLS, CSV, ODS, XML)
  • Ohjaus työpöytä rakenne ja muotoilu
  • Integroida sujuvasti C#/NET-hankkeiden kanssa skalaavalle automatisoinnille

edellytykset

  • Visual Studio 2019 tai uudempi
  • .NET 6.0 tai uudempi
  • Aspose.PDF for .NET asennettuna NuGetin kautta
PM> Install-Package Aspose.PDF

Vaiheittainen toteutus

Vaihe 1: Viittaus vaadittuihin nimivaiheisiin

using Aspose.Pdf.Plugins;
using System.IO;

Vaihe 2: Muunna PDF XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

Käytä tapauksia ja sovelluksia (koodimuutoksilla)

1. Exportti CSV, XLS, ODS tai XML

Määritä haluamasi lähtömuoto käyttämällä Format ja omaisuus:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.ExcelMuokkaa Kaikki tuetut muodot.

2. Batch muuntaa useita PDF-tiedostoja Excelille

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. Minimoi työpöytäkirjojen määrää

Oletusarvoisesti jokainen PDF-sivu muuttuu uudeksi Excelin työpöydäksi.Valitse kaikki sisällöt yhteen työpaikkaan:

options.MinimizeTheNumberOfWorksheets = true;

4. Sisällytä valkoinen sarja alussa

Tietyissä tietojen tuonti skenaarioissa saatat haluta lisätä valkoisen sarjan ensimmäisenä sarjana:

options.InsertBlankColumnAtFirst = true;

Parhaat käytännöt ja vinkit

  • Ennaltaehkäisevä tulos taulukon asetuksen ja tietojen eheyden tarkistamiseksi, varsinkin kun käytät kehittyneitä asetusvaihtoehtoja.
  • Suuriin asiakirjoihin käytä batch-käsittelyä automatisoidaksesi bulk-muuntamisen tehokkaasti.
  • Kun muunnet CSV:een, tarkista delimiters ja koodaus downstream-yhteensopivuutta varten.
  • Korkeasti rakennettujen tai skannattujen PDF-tiedostojen, ennalta käsittelyn asiakirjat parhaan tuloksen.

Täydellinen esimerkki toteutuksesta

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

johtopäätöksiä

Aspose.PDF XLS Converter for .NET mahdollistaa nopean, vakaan ja joustavan PDF-to-Excelin (XLS / XLSX / CSV / XML / ODS) automaation C#-hankkeissa. Poista tiedot PDF:istä, sujuvuusanalyysi ja integroi levytiedoston työnkulut - kaikki yksinkertaisella, korkean suorituskyvyn API:llä. Katso täydellinen API-viittaus lisätietoja muodosta ja vaihtoehdoista.

Usein kysyttyjä kysymyksiä

**Q: Mitä muodoja voin viedä XLSX:n lisäksi?**A: Tuetut muodot sisältävät XLSX, XLSM, CSV, ODS ja Excel 2003 XML. Format omaisuus valitaan.

**Q: Miten voin tallentaa kaikki PDF-sisältö yhteen työpöydään?**A: Sisältää MinimizeTheNumberOfWorksheets = true ja sinun PdfToXlsOptions.

**Q: Mistä voin löytää lisää esimerkkejä tai saada tukea?**A: Katso virallinen Aspose.PDF-dokumentaatio, API-viittaus tai yhteys tuki kehittyneille skenaarioille.

 Suomi