Батч PDF в Excel Conversion для Business Analytics в .NET
С помощью Aspose.PDF.Plugin XlsConverter для .NET вы можете автоматизировать множественные рабочие потоки PDF-to-Excel для отчетности, BI или соответствия, с передовыми опциями для обработки ошибок и выбора формата выхода.
Рабочий поток: Автоматизируйте PDF в Excel для папок
using Aspose.Pdf.Plugins;
using System.IO;
string inputDir = @"C:\Data\PDFs";
string outputDir = @"C:\Data\Excel";
Directory.CreateDirectory(outputDir);
string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");
int success = 0, failed = 0;
foreach (var pdfFile in pdfFiles)
{
string baseName = Path.GetFileNameWithoutExtension(pdfFile);
string outFile = Path.Combine(outputDir, baseName + ".xlsx");
try
{
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(pdfFile));
options.AddOutput(new FileDataSource(outFile));
converter.Process(options);
Console.WriteLine($"Converted: {pdfFile} => {outFile}");
success++;
}
catch (Exception ex)
{
Console.WriteLine($"Failed: {pdfFile} | {ex.Message}");
failed++;
}
}
Console.WriteLine($"Done! Success: {success}, Failed: {failed}");Формат выхода и опции экспорта
- Выход по умолчанию XLSX (Excel
options.FormatДля CSV, если это необходимо. - Настройка рабочего стола по названию или объединение нескольких PDF-файлов в одну рабочую книгу при необходимости.
- Проверьте экспортированные данные для форматирования (главы, слитые клетки) и корректируйте настройки конверсии по мере необходимости.
Ошибка обработки в батареи конверсии
- Отключения для коррумпированных или не поддерживаемых ПДФ (как выше)
- Регистрация всех успехов/неудач для аудита и пересмотра
- Опционально, ретри неудачные конверсии после пересмотра
- Используйте плагин Optimizer для предварительной обработки PDF-файлов для наилучшего качества конверсии
Сценарии использования
- Финансовая, аудиторская или контрактная миграция данных
- BI dashboards, поддерживаемые извлеченными PDF-данными
- Автоматизированные трубопроводы отчетности для соответствия или доставки клиента
Часто задаваемые вопросы
**Q: Могу ли я экспортировать в CSV и Excel?**А: Да — набор options.Format = PdfToXlsOptions.ExcelFormat.CSV Для выхода CSV вместо XLSX.
**Q: Как плагин справляется с неудачными конверсиями?**Ответ: Исключения бросаются на коррумпированные или не поддерживаемые файлы; поймать и записывать их для пересмотра, как в шаблоне кода выше.
**Q: Как я могу улучшить точность конверсии?**Ответ: Используйте плагин Optimizer, чтобы очистить и компрессировать PDF-файлы до конверсии, а также подтвердить выход для последовательной структуры.
Pro Tip: После конверсии комплекта, свяжите выходы Excel напрямую с инструментами BI или импортными скриптами базы данных для истинной автоматизации отчетности конца к концу.