Aspose.OCR을 사용하여 OCR 일자리의 배치 처리 및 일정을 자동화하는 방법
대량 문서 작업 흐름은 신뢰할 수 있고 예상치 못한 OCR 처리가 필요합니다. .NET을 위한 Aspose.OCR은 완전한 패치 자동화를 지원합니다 - 모니터 폴더, 일정 작업, 큰 볼륨을 처리하고 최대 효율성을 위해 오류로부터 회복.
현실 세계 문제
비즈니스는 매일 밤 또는 일주일에 수천 개의 스캔 된 파일을 처리해야합니다.수동 또는 상호 작용 OCR는 스케일하지 않으며 오류 위험을 증가시킵니다.자동화 및 일정은 작업이 신뢰할 수 있도록 보장합니다, 심지어 밤에 또는 시간 내에.
솔루션 검토
Aspose.OCR 배치 APIs, 파일 / 폴더 모니터링 및 일정 도구 (Task Scheduler, cron, 등)를 결합하여 OCR를 스케일로 자동화합니다.
원칙
- Visual Studio 2019 또는 이후
- .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
- NuGet에서 .NET을 위한 ASPOSE.OCR
- (선택) Windows Task Scheduler, cron 또는 다른 작업 자동화 도구
PM> Install-Package Aspose.OCR
단계별 실행
단계 1 : ASPOSE.OCR 설치 및 설정
using Aspose.OCR;
단계 2: 배치 처리 파일을 발견
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
단계 3: 배치에서 OCR를 실행
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
단계 4 : 수출 및 아카이브 결과
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
단계 5 : 일자리 및 오류 기록
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
단계 6 : 자동 일정 (Windows 작업 일정 예제)
- 배치 파일 또는 PowerShell 스크립트를 생성하여 일정에 따라 OCR 작업을 수행합니다.
- Task Scheduler를 사용하여 매일, 밤 또는 트리거에서 실행하십시오.
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
단계 7 : 새로운 파일에 대한 고급 - 파일 모니터링
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
단계 8 : 완전한 예제
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
사례 및 응용 프로그램 사용
기업 메일룸 및 디지털 인보스
자동으로 수입 문서의 배치를 수동 노력이 없이 처리합니다.
건강 관리, 법률 및 아카이브 작업 흐름
의료 기록, 계약 또는 아카이브를위한 밤 또는 주간 OCR 작업을 일정합니다.
금융 및 준수 작업
시간 내에 큰 스캔 배치를 처리하는 자동 보고 및 준수 작업.
일반적인 도전과 해결책
도전 1 : 신뢰할 수없는 매뉴얼 시작
** 솔루션:** 예상치 못한 일자리에 대한 일정 도구를 항상 사용하십시오.
도전 2 : 큰 배치에서 실수
** 솔루션:** 안정적인 작동을 위해 자동 로그 및 오류 처리.
도전 3 : 일자리 과잉 또는 자원 제한
** 솔루션:** Stagger 일자리, 자원 모니터링, 그리고 느리거나 실패에 대한 경고.
성과 고려 사항
- CPU, 메모리 및 디스크 모니터링 고량 작업 중
- 출력 및 오류 기록을 사용하여 포스트 직업 분석
- 배치 작업은 영향을 피하기 위해 시간 내에 계획되어야합니다.
모범 사례
- 다양한 파일 유형 및 볼륨을 가진 테스트 작업
- 실패 또는 느린 성과를 위한 모니터링 기록
- 보안 및 아카이브 원본 및 출력 파일
- 업데이트 및 자동화 스크립트 유지
고급 시나리오
시나리오 1 : 배치 일자리를 비교하거나 분배
스케일에 따라 여러 서버 또는 VM에서 일자리를 분할합니다.
시나리오 2 : 직업 완료에 대한 실시간 경고
계획된 작업이 끝난 후에 이메일 또는 웹호크 알림을 보내십시오.
결론
ASPOSE.OCR for .NET은 강력하고 예상치 못한 OCR 작업 자동화를 가능하게 합니다. 배치 처리 및 계획을 사용하면 신속하고 신뢰할 수 있고 오류 저항적인 작업 흐름을 보장 할 수 있습니다. .NET API 참조를 위한 ASPOSE.OCR 배치 자동화 팁과 코드.