Батч PDF към Excel Conversion за Business Analytics в .NET
Компаниите и аналитиците се нуждаят от данни от стотици или хиляди PDF файлове – бързо. Aspose.PDF.Plugin XlsConverter за .NET, можете да автоматизирате масови PDF-to-Excel работни потоци за докладване, BI или съответствие, с усъвършенствани опции за обработка на грешки и избор на формат за изход.
Работен поток: Автоматизиране на PDF към Excel за папки
using Aspose.Pdf.Plugins;
using System.IO;
string inputDir = @"C:\Data\PDFs";
string outputDir = @"C:\Data\Excel";
Directory.CreateDirectory(outputDir);
string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");
int success = 0, failed = 0;
foreach (var pdfFile in pdfFiles)
{
string baseName = Path.GetFileNameWithoutExtension(pdfFile);
string outFile = Path.Combine(outputDir, baseName + ".xlsx");
try
{
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(pdfFile));
options.AddOutput(new FileDataSource(outFile));
converter.Process(options);
Console.WriteLine($"Converted: {pdfFile} => {outFile}");
success++;
}
catch (Exception ex)
{
Console.WriteLine($"Failed: {pdfFile} | {ex.Message}");
failed++;
}
}
Console.WriteLine($"Done! Success: {success}, Failed: {failed}");Изходни формати и опции за износ
- Стандартният изход е XLSX (Excel
options.FormatАко е необходимо, да се свържете с CSV. - Приспособяване на имената на работния лист или комбиниране на няколко PDF файла в една работна книга, ако е необходимо.
- Преглед на изнесените данни за форматиране (глави, сливани клетки) и коригиране на настройките за конверсия, както е необходимо.
Използване на грешки в Batch Conversion
- Вземи изключения за корумпирани или неподходящи PDF файлове (както е по-горе)
- Регистриране на всички успехи / неуспехи за одит и преглед
- Опционално, оттегляне на неуспешни конверсии след преглед
- Използвайте плъгина Optimizer за предварително обработване на PDF файлове за най-добро качество на конверсията
Използване на случаите
- Финансова, одитна или договорна миграция на данни
- BI панели, задвижвани от извлечени PDF данни
- Автоматизирани тръбопроводи за докладване за съответствие или доставка на клиенти
Често задавани въпроси
**Q: Мога ли да експортирам към CSV и Excel?**A: Да – сет options.Format = PdfToXlsOptions.ExcelFormat.CSV за CSV изход вместо XLSX.
**Q: Как плагинът се справя с неуспешни конверсии?**A: Изключенията се хвърлят за корумпирани или неподходящи файлове; улавяне и записване на тях за преглед, както е в кодовата проба по-горе.
**Q: Как мога да подобря точността на конверсията?**A: Използвайте плъгина Optimizer, за да почистите и компресирате PDF файлове преди конверсията и да валидирате резултата за последователна структура.
Про Съвет: След конвертиране на комплекта, свържете изходите на Excel директно към BI инструменти или база данни внос скрипти за истинска автоматизация на докладване от край на край.