OCR를 문서 관리 및 작업 흐름 자동화에 통합하는 방법

OCR를 문서 관리 및 작업 흐름 자동화에 통합하는 방법

현대 조직은 스캔 된 문서, 이메일 및 이미지에 대한 정보에 빠르고 자동화 된 액세스를 요구합니다.이 데이터를 수동으로 처리하고 입력하면 비즈니스가 느려지고 오류가 발생하고 준수 위험이 증가됩니다. .NET을위한 Aspose.OCR은 서류 관리 시스템 (DMS)에 무제한 OCR 통합을 허용하고 전체 문자 작업 흐름을 자동으로합니다..

현실 세계 문제

법률, 인적, 또는 금융 팀은 검색, 준수 또는 비즈니스 작업 흐름을 위해 수천 개의 스캔 된 문서 또는 이미지를 신속하게 처리하고 인덱스해야합니다.

솔루션 검토

Aspose.OCR for .NET은 DMS 또는 작업 흐름 자동화 솔루션, 새로운 파일을 모니터링, 콘텐츠 추출 및 자동으로 비즈니스 데이터베이스, APIs 또는 클라우드 저장소로 인식 된 텍스트를 수출 할 수 있습니다.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • DMS 또는 작업 흐름 API, 데이터베이스 또는 클라우드 스토리지에 대한 액세스
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2: 입력 출처를 설정 (폴더, 클라우드 또는 API)

string inputFolder = "./scans";
foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
{
    // Add to processing queue
}

단계 3 : OCR 처리 설정

OcrInput input = new OcrInput(InputType.PDF);
input.Add("document.pdf");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;

단계 4 : 텍스트 추출 및 DMS/Workflow에 수출

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
    string text = result.RecognitionText;
    // Export: Upload to API, save to DB, send to workflow, etc.
    File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
}

단계 5: 배치 일자리, 오류 및 알림 처리

try
{
    // OCR and export code here
}
catch (Exception ex)
{
    // Log or notify admin
    Console.WriteLine($"Error: {ex.Message}");
}

단계 6: 비즈니스 API 또는 데이터베이스와 통합

  • ADO.NET, Entity Framework 또는 REST API 클라이언트를 사용하여 수출
  • 처리 후 알림 또는 웹 호크를 보내기
// Example pseudo-code for REST API upload
// UploadToDmsApi(text, metadata);

단계 7 : 보안 및 준수를 위해 최적화

  • 보안 데이터는 트랜지스 및 휴식 시간에 암호화됩니다.
  • 모든 OCR 및 수출 활동에 대한 감사 기록을 추가합니다.

단계 8 : 모니터, 스케일 및 자동화

  • 배경 서비스, 꼬리 또는 큰 작업을위한 일정을 사용하십시오.
  • 출력 폴더 및 직업 상태를 모니터링
// Example: FileSystemWatcher to trigger on new files
// new FileSystemWatcher("./scans")

단계 9 : 완전한 예제 (Batch Automation)

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./scans";
            OcrInput input = new OcrInput(InputType.PDF);
            foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            foreach (RecognitionResult result in results)
            {
                string text = result.RecognitionText;
                File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
                // Optionally export to database or API
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

사례 및 응용 프로그램 사용

자동 탑승

자동 처리 및 DMS에 계약, 양식 및 ID 문서를 저장합니다.

청구서 및 계좌 지불 자동화

수출 및 청구서 데이터를 ERP, AP 또는 작업 흐름 엔진에 직접 밀어 넣으십시오.

준수 및 감사 준비

자동 OCR 및 수출 대규모 준수 문서 아카이브 및 보고.

일반적인 도전과 해결책

도전 1 : 큰, 버스티 문서 충전

** 솔루션:** 퀴즈, 배경 작업자 및 오프 타임 일정을 사용합니다.

도전 2 : API 또는 수출 오류

** 솔루션:** 탈퇴, 로그 및 실패 알림을 추가합니다.

도전 3 : 민감한 데이터 처리

** 솔루션:** 데이터 암호화, 액세스를 제한하고 모든 행동을 검토합니다.

성과 고려 사항

  • 배치 작업은 스케일링이 필요할 수 있습니다 (CPU, I/O)
  • 시스템 성능 모니터링 및 출력 퀴즈
  • OCR 개체를 갖추고 DB/API 연결을 닫습니다.

모범 사례

  • 비즈니스 요구 사항에 대하여 수출 결과를 검증
  • 모든 의존성 및 보안 설정을 정기적으로 업데이트합니다.
  • 문서화 및 모든 자동화 단계를 모니터링
  • 분리된 테스트/dev 및 생산 환경

고급 시나리오

시나리오 1: 클라우드 통합

OCR 결과를 클라우드 DMS (SharePoint, Google 드라이브 등)로 업로드합니다.

시나리오 2 : 실시간 작업 흐름 트리거

새로운 텍스트가 인식되면 다운로드 작업 흐름이나 경고를 유발합니다.

결론

ASPOSE.OCR for .NET은 비즈니스 작업 흐름과 DMS 플랫폼과의 통합을 촉진하여 최소한의 코드로 정보 추출 및 문서 처리를 자동화할 수 있습니다.

고급 자동화 및 API 샘플을 위해, 방문 .NET API 참조를 위한 ASPOSE.OCR .

 한국어