Aspose.OCR을 사용하여 OCR 일자리의 배치 처리 및 일정을 자동화하는 방법

Aspose.OCR을 사용하여 OCR 일자리의 배치 처리 및 일정을 자동화하는 방법

대량 문서 작업 흐름은 신뢰할 수 있고 예상치 못한 OCR 처리가 필요합니다. .NET을 위한 Aspose.OCR은 완전한 패치 자동화를 지원합니다 - 모니터 폴더, 일정 작업, 큰 볼륨을 처리하고 최대 효율성을 위해 오류로부터 회복.

현실 세계 문제

비즈니스는 매일 밤 또는 일주일에 수천 개의 스캔 된 파일을 처리해야합니다.수동 또는 상호 작용 OCR는 스케일하지 않으며 오류 위험을 증가시킵니다.자동화 및 일정은 작업이 신뢰할 수 있도록 보장합니다, 심지어 밤에 또는 시간 내에.

솔루션 검토

Aspose.OCR 배치 APIs, 파일 / 폴더 모니터링 및 일정 도구 (Task Scheduler, cron, 등)를 결합하여 OCR를 스케일로 자동화합니다.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • (선택) Windows Task Scheduler, cron 또는 다른 작업 자동화 도구
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2: 배치 처리 파일을 발견

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

단계 3: 배치에서 OCR를 실행

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

단계 4 : 수출 및 아카이브 결과

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

단계 5 : 일자리 및 오류 기록

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

단계 6 : 자동 일정 (Windows 작업 일정 예제)

  • 배치 파일 또는 PowerShell 스크립트를 생성하여 일정에 따라 OCR 작업을 수행합니다.
  • Task Scheduler를 사용하여 매일, 밤 또는 트리거에서 실행하십시오.
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

단계 7 : 새로운 파일에 대한 고급 - 파일 모니터링

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

단계 8 : 완전한 예제

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

사례 및 응용 프로그램 사용

기업 메일룸 및 디지털 인보스

자동으로 수입 문서의 배치를 수동 노력이 없이 처리합니다.

건강 관리, 법률 및 아카이브 작업 흐름

의료 기록, 계약 또는 아카이브를위한 밤 또는 주간 OCR 작업을 일정합니다.

금융 및 준수 작업

시간 내에 큰 스캔 배치를 처리하는 자동 보고 및 준수 작업.

일반적인 도전과 해결책

도전 1 : 신뢰할 수없는 매뉴얼 시작

** 솔루션:** 예상치 못한 일자리에 대한 일정 도구를 항상 사용하십시오.

도전 2 : 큰 배치에서 실수

** 솔루션:** 안정적인 작동을 위해 자동 로그 및 오류 처리.

도전 3 : 일자리 과잉 또는 자원 제한

** 솔루션:** Stagger 일자리, 자원 모니터링, 그리고 느리거나 실패에 대한 경고.

성과 고려 사항

  • CPU, 메모리 및 디스크 모니터링 고량 작업 중
  • 출력 및 오류 기록을 사용하여 포스트 직업 분석
  • 배치 작업은 영향을 피하기 위해 시간 내에 계획되어야합니다.

모범 사례

  • 다양한 파일 유형 및 볼륨을 가진 테스트 작업
  • 실패 또는 느린 성과를 위한 모니터링 기록
  • 보안 및 아카이브 원본 및 출력 파일
  • 업데이트 및 자동화 스크립트 유지

고급 시나리오

시나리오 1 : 배치 일자리를 비교하거나 분배

스케일에 따라 여러 서버 또는 VM에서 일자리를 분할합니다.

시나리오 2 : 직업 완료에 대한 실시간 경고

계획된 작업이 끝난 후에 이메일 또는 웹호크 알림을 보내십시오.

결론

ASPOSE.OCR for .NET은 강력하고 예상치 못한 OCR 작업 자동화를 가능하게 합니다. 배치 처리 및 계획을 사용하면 신속하고 신뢰할 수 있고 오류 저항적인 작업 흐름을 보장 할 수 있습니다. .NET API 참조를 위한 ASPOSE.OCR 배치 자동화 팁과 코드.

 한국어