Comment convertir PDF à Excel (XLS / XLSX / CSV) dans .NET
Cet article montre comment convertir programmatiquement les documents PDF dans les formats Microsoft Excel (XLS, XLSX, CSV, et plus) en utilisant l’Aspose.PDF XLS Converter pour .NET. Cela vous permet de désactiver, d’analyser et de transférer automatiquement des données de PDF à des panneaux de diffusion pour le traitement ultérieur, le rapport ou l’archivage.
Problème du monde réel
Exporter des tables ou des données structurées de PDF à Excel manuellement est un travail intense et sans erreur. l’automatisation de cette conversion est essentielle pour les flux de travail en finance, rapport, analyse et conformité où les opérations de bulk PDF-to-breadsheet sont nécessaires.
Vue de la solution
Aspose.PDF XLS Converter pour .NET vous permet de:
- Convertir un ou plusieurs fichiers PDF à Excel (XLSX, XLS, CSV, ODS, XML)
- Contrôle de la structure et du formatage des feuilles de travail
- Intégrer doucement avec les projets C#/NET pour l’automatisation scalable
Principaux
- Visual Studio 2019 ou ultérieur
- .NET 6.0 ou ultérieur
- Aspose.PDF pour .NET installé via NuGet
PM> Install-Package Aspose.PDF
La mise en œuvre étape par étape
Étape 1 : référence des espaces de nom nécessaires
using Aspose.Pdf.Plugins;
using System.IO;
Étape 2 : Convertir un PDF en XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
Utilisation de cas et d’applications (avec variations de code)
1. Exportation vers CSV, XLS, ODS ou XML
Déterminer le format de sortie souhaité en utilisant le Format
Propriétés :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.ExcelFormat pour tous les formats soutenus.
2. Batch Convert Multiple PDFs à Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. Minimiser le nombre de feuilles de travail
Par défaut, chaque page PDF devient une nouvelle feuille de travail d’Excel. Pour enregistrer tous les contenus dans un seul feuillage:
options.MinimizeTheNumberOfWorksheets = true;
4. Insérer une colonne blanche au début
Pour certains scénarios d’importation de données, vous pouvez vouloir ajouter une colonne blanche comme la première colonie:
options.InsertBlankColumnAtFirst = true;
Meilleures pratiques et conseils
- Prévisions de la sortie pour vérifier la configuration de table et l’intégrité des données, en particulier lorsque vous utilisez les options de layout avancées.
- Pour les grands documents, utilisez le traitement de pièces pour automatiser la conversion en masse efficacement.
- Lors de la conversion en CSV, vérifiez les délimitants et codez pour la compatibilité en bas.
- Pour les PDF hautement structurés ou scannés, les documents pré-proces pour les meilleurs résultats.
Exemple de mise en œuvre complète
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
Conclusion
L’Aspose.PDF XLS Converter pour .NET permet l’automatisation rapide, robuste et flexible de PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) dans les projets C#. Déconnecter les données des PDF, les analyses de ligne et intégrer les flux de travail des brochures - tout avec une API simple et de haute performance. Voir la référence API complète pour plus de détails sur le format et les options.
Questions fréquentes posées
**Q: Quels formats puis-je exporter en plus de XLSX?**A: Les formats supportés comprennent XLSX, XLSM, CSV, ODS et Excel 2003 XML. Format
Propriété à sélectionner.
**Q: Comment puis-je sauvegarder tous les contenus PDF dans une seule feuille de travail?**A : Sélection MinimizeTheNumberOfWorksheets = true
sur votre PdfToXlsOptions
.
**Q : Où puis-je trouver plus d’exemples ou obtenir un soutien ?**A: Voir la documentation officielle Aspose.PDF, référence API, ou support de contact pour les scénarios avancés.