Πώς να μετατρέψετε το PDF σε Excel (XLS / XLSX / CSV) σε .NET
Αυτό το άρθρο δείχνει πώς να μετατρέψετε προγραμματικά τα αρχεία PDF σε μορφές του Microsoft Excel (XLS, XLSX, CSV, και πολλά άλλα) χρησιμοποιώντας το ASPOSE.PDF XLS Converter για .NET. Αυτό σας επιτρέπει να αποκλείσετε, να αναλύσετε και να αυτοματοποιήσετε τη μεταφορά δεδομένων από PDFs σε πλάκες για περαιτέρω επεξεργασία, αναφορά ή αρχειοθέτηση.
Το πρόβλημα του πραγματικού κόσμου
Η εξαγωγή πίνακων ή δομημένων δεδομένων από τα PDF στο Excel με το χέρι είναι εργασιακή ένταση και ελαττωματική. Η αυτοματοποίηση αυτής της μετατροπής είναι ζωτικής σημασίας για τις ροές εργασίας στη χρηματοδότηση, την αναφορά, τη ανάλυση και τη συμμόρφωση όπου απαιτούνται μαζικές λειτουργίες PDF-to-breadsheet.
Συνοπτική λύση
Το ASPOSE.PDF XLS Converter για .NET σας επιτρέπει:
- Μετατρέψτε ένα ή περισσότερα PDF σε αρχεία Excel (XLSX, XLS, CSV, ODS, XML)
- Ελέγξτε τη δομή εργαστηρίου και τη διαμόρφωση
- Ενεργοποιήστε με ευέλικτο τρόπο με τα έργα C#/NET για κλιμακώδη αυτοματοποίηση
Προϋποθέσεις
- Visual Studio 2019 ή αργότερα
- .NET 6.0 ή αργότερα
- Aspose.PDF για .NET εγκατεστημένο μέσω NuGet
PM> Install-Package Aspose.PDF
Βήμα προς βήμα εφαρμογή
Βήμα 1: Αναφορά των απαιτούμενων ονομαστικών χώρων
using Aspose.Pdf.Plugins;
using System.IO;
Βήμα 2: Μετατρέψτε ένα PDF σε XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Χρήση περιπτώσεων και εφαρμογών (με κώδικα μεταβολών)
1. Εξαγωγή σε CSV, XLS, ODS ή XML
Προσδιορίστε την επιθυμητή μορφή εξόδου χρησιμοποιώντας το Format
Ιδιοκτησία :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsΕπιλογές.ExcelFormat για όλες τις υποστηριζόμενες μορφές.
2. Batch Μετατρέψτε πολλαπλά PDF σε Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Μειώστε τον αριθμό των φύλλων εργασίας
Κατά προεπιλογή, κάθε σελίδα PDF μετατρέπεται σε ένα νέο φύλλο εργασίας του Excel. Για να αποθηκεύσετε όλα τα περιεχόμενα σε μια ενιαία φύλλα εργασίας:
options.MinimizeTheNumberOfWorksheets = true;
4. Να εισαγάγετε μια λευκή στήλη στην αρχή
Για ορισμένα σενάρια εισαγωγής δεδομένων, ενδέχεται να θέλετε να προσθέσετε μια λευκή στήλη ως την πρώτη:
options.InsertBlankColumnAtFirst = true;
Καλύτερες πρακτικές και συμβουλές
- Προεπισκόπηση της παραγωγής για να επαληθεύσετε τη διάταξη του πίνακα και την ακεραιότητα των δεδομένων, ειδικά όταν χρησιμοποιείτε προηγμένες επιλογές διαμόρφωσης.
- Για μεγάλα έγγραφα, χρησιμοποιήστε την επεξεργασία συσκευών για να αυτοματοποιήσετε την μετατροπή μάζας αποτελεσματικά.
- Όταν μετατρέπετε σε CSV, επαληθεύστε τους διαχωριστές και την κωδικοποίηση για τη συμβατότητα downstream.
- Για πολύ δομημένα ή σαρωμένα PDF, προδιαδικαστικά έγγραφα για τα καλύτερα αποτελέσματα.
Ολοκληρωμένο παράδειγμα εφαρμογής
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Συμπεράσματα
Το Aspose.PDF XLS Converter για .NET επιτρέπει την ταχεία, σταθερή και ευέλικτη αυτοματοποίηση PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) σε έργα C#. Αποκλείστε τα δεδομένα από τα PDF, την ανάλυση απλών γραμμών και ενσωματώστε τις ροές εργασίας της πλάκας - όλα με ένα απλό, υψηλής απόδοσης API. Δείτε την πλήρη αναφορά API για περισσότερες λεπτομέρειες μορφής και επιλογών.
Συχνές ερωτήσεις
**Q: Ποιες μορφές μπορώ να εξάγω εκτός από το XLSX;**Α: Οι υποστηριζόμενες μορφές περιλαμβάνουν XLSX, XLSM, CSV, ODS και Excel 2003 XML. Format
ιδιοκτησία για να επιλέξετε.
**Q: Πώς μπορώ να αποθηκεύσω όλα τα περιεχόμενα PDF σε ένα μόνο φύλλο εργασίας;**Α: Σημείωση MinimizeTheNumberOfWorksheets = true
Στον δικό σου PdfToXlsOptions
.
**Q: Πού μπορώ να βρω περισσότερα παραδείγματα ή να λάβω υποστήριξη;**Α: Δείτε την επίσημη τεκμηρίωση Aspose.PDF, αναφορά API ή υποστήριξη επαφής για προηγμένα σενάρια.