Aspose.OCR을 사용하여 여러 형식으로 OCR 결과를 수출하는 방법
비즈니스, 법률 및 준수 작업 흐름은 종종 통합, 보고 및 아카이브를 위해 여러 디지털 형식의 OCR 결과를 필요로합니다. .NET을 위한 Aspose.OCR은 TXT, Docx, XLSX, PDF 및 JSON과 같은 일반적인 형태로 유연한 수출을 제공하며 단 하나의 메서드 호출이 있습니다.
현실 세계 문제
OCR를 통해 추출된 데이터는 동료들과 공유해야 하며, ERP 또는 BI 도구에 가져오거나, 아카이브하거나, 더 많이 처리해야 합니다.
솔루션 검토
Aspose.OCR은 각 인식 결과에 대한 출력 형식을 선택할 수 있습니다 - 깔끔한 텍스트, 포맷 된 Word, Excel 테이블, 검색 가능한 PDF 또는 구조화 된 JSON.
원칙
- Visual Studio 2019 또는 이후
- .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
- NuGet에서 .NET을 위한 ASPOSE.OCR
- 기본 C# 프로그래밍 기술
PM> Install-Package Aspose.OCR
단계별 실행
단계 1 : ASPOSE.OCR 설치 및 설정
using Aspose.OCR;
단계 2: 텍스트, 테이블 또는 이미지를 인식
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
단계 3: OCR 결과를 여러 형식으로 수출
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
단계 4 : 자동 배치 수출
원하는 형식으로 폴더에서 처리 된 모든 이미지를 내보내십시오 :
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
단계 5 : 실수를 처리하고 유효한 수출
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
단계 6 : Downstream Workflows와 통합
수출 된 파일을 사용 하 여:
- 보고 및 BI 다이어트 (Excel, JSON)
- 문서 관리 (PDF, DOCX)
- 자동화 스크립트 (TXT, JSON)
단계 7 : 완전한 예제
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
사례 및 응용 프로그램 사용
ERP / 데이터베이스 통합
자동 게시 및 검색을 위한 Excel, JSON 또는 TXT 출력을 가져옵니다.
문서 관리 및 아카이브
PDF, DOCX 또는 TXT에서 검색할 수 있는, 준수된 레코드를 만드십시오.
비즈니스 보고
인기있는 BI 다이어트 또는 여러 형식으로 결과를 공유합니다.
일반적인 도전과 해결책
도전 1 : 각 사용을위한 올바른 형식을 선택
** 솔루션:** 비즈니스 요구 사항 및 관객에 대한 지도 출력.
도전 2 : 수출 오류 또는 파일 과열
** 솔루션:** 파일 존재 검사 및 시간표 이름을 추가합니다.
도전 3 : 대규모 배치 수출
** 솔루션:** 자동화 및 배치 작업을 일정; 수출 폴더 건강 모니터링.
성과 고려 사항
- 대형 파일을 여러 형식으로 수출하면 처리 시간을 늘릴 수 있습니다.
- 디스크 공간 및 폴더 구조 모니터링
- 정기적으로 수출된 파일을 검증합니다.
모범 사례
- 추적 및 검색을 위한 이름 수출
- 보안 및 백업 수출 된 파일
- 실제 세계 비즈니스 샘플 테스트
- 최신 수출 기능을 위한 Aspose.OCR 업데이트
고급 시나리오
시나리오 1 : 사용자 지정 또는 수출 경로
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
시나리오 2 : 특정 데이터만 수출 (예 : 테이블)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
결론
Aspose.OCR for .NET은 작업 흐름, 동료 및 시스템이 필요로하는 형식으로 OCR 결과를 쉽게 제공합니다 - 최소한의 노력으로 자동화, 공유 및 통합을 촉진합니다.
보세요 The .NET API 참조를 위한 ASPOSE.OCR 최신 지원된 수출 형식 및 고급 기능에 대 한.