배치 청구서 데이터 추출 및 인증을 자동화하는 방법

배치 청구서 데이터 추출 및 인증을 자동화하는 방법

스케일에 자동화 된 청구서 데이터 추출은 금융 팀이 수동 노력을 줄이고, 지불 할 수있는 계좌를 가속화하고, 오류를 최소화하는 데 도움이됩니다. Aspose.OCR Invoice to Text for .NET은 스캔되거나 촬영 된 요금으로부터 인출 및 인증을 촉진합니다.

현실 세계 문제

수백 또는 수천 개의 청구서의 수동 데이터 입력은 느리고, 비싸고, 오류가 발생합니다. 총, 날짜 또는 판매자에 대한 실수는 금융 시스템 및 준수 문제를 창출한다.

솔루션 검토

배치는 청구서의 폴더를 처리하고, 구조화 된 데이터를 추출하고 검증합니다 ( 총, 공급자, 날짜와 같은), 그리고 ERP 수입 또는 검토에 대한 수출 결과 - 모두 높은 정확도로.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • 스캔 또는 촬영 된 청구서 이미지의 폴더 (JPG, PNG, PDF)
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : 청구서 배치 준비

string[] invoiceFiles = Directory.GetFiles("./invoices", "*.pdf"); // or *.jpg, *.png

단계 2 : 청구서 인식 및 인증 설정

using Aspose.OCR;
List<string> errors = new List<string>();
InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();

단계 3: 각 청구서를 처리, 추출 및 인증

using (var writer = new StreamWriter("invoice_results.csv"))
{
    writer.WriteLine("File,Vendor,Date,Total,Status,Error");
    foreach (var file in invoiceFiles)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add(file);
            var results = ocr.RecognizeInvoice(input, settings);
            var text = results[0].RecognitionText;
            // Example: Extract fields with regex or parsing
            string vendor = ExtractField(text, "Vendor:");
            string date = ExtractField(text, "Date:");
            string total = ExtractField(text, "Total:");
            bool valid = ValidateInvoiceData(vendor, date, total);
            writer.WriteLine($"{file},{vendor},{date},{total},{(valid ? "Valid" : "Invalid")},");
        }
        catch (Exception ex)
        {
            writer.WriteLine($"{file},,,,Error,{ex.Message}");
        }
    }
}
// Helper methods to extract and validate fields (simplified)
string ExtractField(string text, string fieldName)
{
    // Implement regex or logic to extract field from text
    return ""; // Example stub
}
bool ValidateInvoiceData(string vendor, string date, string total)
{
    // Implement checks for expected formats, totals, required fields
    return !string.IsNullOrEmpty(vendor) && !string.IsNullOrEmpty(date) && !string.IsNullOrEmpty(total);
}

단계 4 : 수출 / 통합 결과

  • CSV를 사용하여 검토, ERP/회계에 가져오거나 추가 자동화

사례 및 응용 프로그램 사용

계좌 지불 자동화

일시적인 지불을 위해 공급자 청구서의 대량을 처리하고 검증합니다.

ERP / 금융 통합

유효한 청구서 데이터를 ERP 또는 회계 시스템에 삽입하여 작업을 신속하게 수행합니다.

컨설팅 & 준수

각 처리된 청구서 패치에 대한 자세한 기록 및 오류 보고서를 유지합니다.

일반적인 도전과 해결책

도전 1 : 다양한 청구서 형식

** 솔루션:** 공급자 / 템플릿에 따라 튜닝 레지크스, 필드 추출 및 OCR 설정.

도전 2 : 스캔 또는 이미지 오류

** 솔루션:** 사전 처리 필터를 사용하여 더 나은 품질을 요청하고 검토를 위해 깃발을 사용합니다.

도전 3 : 실종 또는 불완전한 필드

** 솔루션:** 인간 검토를 위한 실종/실패 필드를 인증하고 보고합니다.

성과 고려 사항

  • 배치 직업은 몇 시간 동안 실행할 수 있습니다 - 일정 시간
  • 오류율을 모니터링하고 실패한 결과를 수동으로 검토합니다.

모범 사례

  • 작은 샘플에 대 한 테스트 배치 작업 먼저
  • 정기적으로 검토 및 추출 / 인증 논리
  • 모든 실수와 성공을 기록
  • 검토를 위한 입력 및 출력 데이터 백업

고급 시나리오

시나리오 1 : 병렬 배치 처리

Parallel.ForEach 또는 async 작업을 매우 큰 청구서 세트에 사용하십시오.

시나리오 2 : 오류에 대한 자동 통지

확인 실패 또는 오류가 발생하는 경우 이메일 / 알림을 보내십시오.

결론

ASPOSE.OCR Invoice to Text for .NET은 배치 청구서 자동화에 이상적이며, 금융 팀이 계산 데이터를 정확하게 확장, 검증 및 통합하는 데 도움이됩니다.

더 진보된 통합 및 파싱 팁을 찾으십시오. .NET API 참조를 위한 ASPOSE.OCR .

 한국어