.NET에서 비즈니스 애널리즘을 위한 PDF에서 Excel로 변환
.NET에서 비즈니스 애널리즘을 위한 PDF에서 Excel로 변환
기업 팀 및 분석가들은 수백 또는 수천 개의 PDF에서 데이터를 필요로합니다. Aspose.PDF.Plugin XlsConverter for .NET을 사용하면 보고, BI 또는 준수를 위해 대량 PDF-to-Excel 작업 흐름을 자동화할 수 있으며 오류 처리 및 출력 형식 선택을 위한 고급 옵션이 있습니다.
배치 작업 흐름 : 폴더를 위한 PDF에서 Excel로 자동화
using Aspose.Pdf.Plugins;
using System.IO;
string inputDir = @"C:\Data\PDFs";
string outputDir = @"C:\Data\Excel";
Directory.CreateDirectory(outputDir);
string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");
int success = 0, failed = 0;
foreach (var pdfFile in pdfFiles)
{
string baseName = Path.GetFileNameWithoutExtension(pdfFile);
string outFile = Path.Combine(outputDir, baseName + ".xlsx");
try
{
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(pdfFile));
options.AddOutput(new FileDataSource(outFile));
converter.Process(options);
Console.WriteLine($"Converted: {pdfFile} => {outFile}");
success++;
}
catch (Exception ex)
{
Console.WriteLine($"Failed: {pdfFile} | {ex.Message}");
failed++;
}
}
Console.WriteLine($"Done! Success: {success}, Failed: {failed}");출력 형식 및 수출 옵션
- 기본 출력은 XLSX (Excel)입니다.
options.Format필요한 경우 CSV를 사용합니다. - 필요한 경우 워크시트 이름을 사용자 정의하거나 여러 PDF를 하나의 작업장으로 결합합니다.
- 포맷을위한 수출 된 데이터 (머리, 합성 세포)를 검토하고 필요한 경우 변환 설정을 조정합니다.
배치 변환에서 오류 처리
- 부패하거나 지원되지 않은 PDF에 대한 캡처 예외 (상위와 같이)
- 모든 성공/실패를 기록하여 감사 및 검토
- 선택적으로, 검토 후 실패한 변환을 철회
- 최적의 변환 품질을 위해 프리 프로세스 PDF에 Optimizer 플러그인을 사용하십시오.
사용 사례
- 기업 전반 금융, 감사 또는 계약 데이터 이주
- 추출된 PDF 데이터를 통해 공급되는 BI 다스크보드
- 준수 또는 고객 배달을 위한 자동 보고 튜브
자주 묻는 질문들
**Q: CSV와 Excel에 수출할 수 있습니까?**A : 예 - 세트 options.Format = PdfToXlsOptions.ExcelFormat.CSV XLSX 대신 CSV 출력.
**Q: 플러그인이 실패한 변환을 어떻게 처리합니까?**A: 예외는 부패하거나 지원되지 않은 파일에 대해 던져집니다; 위의 코드 샘플과 같이 검토를 위해 캡처하고 로그.
**Q : 어떻게 변환 정확도를 향상시킬 수 있습니까?**A: 최적화 플러그인을 사용하여 변환 전에 PDF를 청소하고 압축하고 일관된 구조를 위해 출력을 확인합니다.
프로 팁: 배치 변환 후, 진정한 끝에서 끝까지 보고 자동화를 위해 BI 도구 또는 데이터베이스 수입 스크립트에 Excel 출력을 직접 연결합니다.