.NET에서 PDF를 Excel (XLS / XLSX / CSV)로 변환하는 방법
이 기사에서는 ASPOSE.PDF XLS Converter for .NET을 사용하여 PDF 문서를 Microsoft Excel 형식으로 프로그래밍적으로 변환하는 방법을 보여줍니다.이 문서는 PDF에서 스프레드 탭으로 데이터 전송을 잠금, 분석 및 자동화하여 더 많은 처리, 보고 또는 아카이브를 수행 할 수 있습니다.
현실 세계 문제
PDF에서 Excel로 수동으로 테이블이나 구조된 데이터를 수출하는 것은 열심히 일하고 오류가 발생합니다.이 변환을 자동화하는 것이 금융, 보고, 분석 및 준수 분야의 작업 흐름에 필수적입니다.
솔루션 검토
Aspose.PDF XLS Converter for .NET은 다음을 허용합니다.
- 단일 또는 여러 PDF를 Excel 파일로 변환 (XLSX, XLS, CSV, ODS, XML)
- 컨트롤 워크시트 구조 및 포맷
- 스케일 가능한 자동화를 위한 C#/NET 프로젝트와 부드럽게 통합
원칙
- Visual Studio 2019 또는 이후
- .NET 6.0 또는 이후
- NuGet을 통해 설치된 .NET을 위한 Aspose.PDF
PM> Install-Package Aspose.PDF
단계별 실행
단계 1 : 참조 필요한 이름 공간
using Aspose.Pdf.Plugins;
using System.IO;
단계 2: PDF를 XLSX로 변환
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
사용 사례 및 응용 프로그램 (코드 변형과 함께)
1. CSV, XLS, ODS 또는 XML으로 수출
원하는 출력 형식을 사용하여 지정합니다. Format
부동산 :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXls옵션.ExcelFormat 모든 지원되는 형식에 대 한
2. Batch 여러 PDF를 Excel로 변환
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. 작업장 수를 최소화하십시오
기본적으로, 각 PDF 페이지는 새 Excel 워크시트가됩니다.모든 콘텐츠를 하나의 일자리에 저장하려면:
options.MinimizeTheNumberOfWorksheets = true;
4. 시작에 흰색 열을 입력합니다
특정 데이터 수입 시나리오의 경우 첫 번째 열로 흰색 열을 추가하고 싶을 수 있습니다.
options.InsertBlankColumnAtFirst = true;
최고의 관행 및 팁
- 테이블 배열 및 데이터 무결성을 확인하기 위해 사전 출력, 특히 고급 배치 옵션을 사용할 때.
- 큰 문서의 경우, 대량 변환을 효율적으로 자동화하기 위해 배치 처리를 사용하십시오.
- CSV로 변환할 때, delimiters를 확인하고 downstream 호환성을 위해 암호화합니다.
- 고도로 구조화되거나 스캔 된 PDF, 최상의 결과를 위해 사전 처리 문서.
완전한 실행 예제
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
결론
Aspose.PDF XLS Converter for .NET은 C# 프로젝트에서 빠르고, 강력하고, 유연한 PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) 자동화를 가능하게 합니다. PDF에서 데이터를 해제, 스트리밍 분석 및 통합 스파이더 작업 흐름 - 모두 간단하고 고성능 API를 사용합니다.
자주 묻는 질문들
**Q: XLSX 외에 어떤 형식으로 수출할 수 있습니까?**A: 지원되는 형식은 XLSX, XLSM, CSV, ODS 및 Excel 2003 XML을 포함합니다. Format
선택할 수 있는 재산
**Q: 어떻게 모든 PDF 콘텐츠를 하나의 워크시트에 저장할 수 있습니까?**A : 세트 MinimizeTheNumberOfWorksheets = true
당신의 위에 PdfToXlsOptions
.
**Q: 어디에서 더 많은 예를 찾을 수 있습니까 또는 지원을 받으십시오?**A: 공식 Aspose.PDF 문서, API 참조, 또는 고급 시나리오에 대한 연락처 지원을 확인합니다.