Aspose.OCR을 사용하여 청구서에서 핵심 정보를 추출하는 방법

Aspose.OCR을 사용하여 청구서에서 핵심 정보를 추출하는 방법

수동으로 청구서를 처리하는 것은 느리고 비싸고, 특히 규모에 따라 오류가 발생합니다. ASPOSE.OCR Invoice to Text for .NET은 스캔되거나 촬영 된 문서에서 모든 핵심 계좌 필드를 자동으로 추출하여 회계를 가속화하고 실수를 줄일 수 있습니다.

현실 세계 문제

수동 청구서 입력은 지불 사이클을 느리게하고 오류를 제시하고 귀중한 직원 시간을 차지합니다. 데이터 캡처를 자동화하는 것은 현대 계정 및 재정 자동화를위한 중요한 요소입니다.

솔루션 검토

ASPOSE.OCR for .NET은 청구서 이미지 및 PDF를 인식하고, 수수료 번호, 날짜, 공급자, 전체와 같은 필드를 추출하고 ERP, 데이터베이스 또는 스파이더에서 사용하기 위한 구조화된 데이터로 출력할 수 있습니다.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • 기본 C# 프로그래밍 경험
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2: 청구서 이미지 또는 PDF를 준비합니다.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// For PDFs:
// OcrInput input = new OcrInput(InputType.PDF);
// input.Add("invoices.pdf");

단계 3 : 청구서 인식 설정 설정

InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English; // Adjust if needed

단계 4 : 키 청구 정보 추출

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

5단계: 인식된 데이터를 수출하거나 통합

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
    result.Save("invoice_result.txt", SaveFormat.Text);
    result.Save("invoice_result.json", SaveFormat.Json); // For structured data
}

단계 6 : 오류 처리 추가

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

단계 7 : 레이아웃 및 배치 작업을 최적화

  • 최상의 정확성을 위해 높은 해상도 스캔 또는 잘 밝은 사진을 사용하십시오.
  • 언어, 레이아웃 또는 예상된 청구서 형식에 대한 설정 조정
  • 효율성을 위해 디렉토리에 있는 모든 파일을 배치합니다.
foreach (string file in Directory.GetFiles("./invoices", "*.png"))
{
    input.Add(file);
}

단계 8 : 완전한 예제

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice1.png");
            input.Add("invoice2.jpg");

            InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("invoice_result.txt", SaveFormat.Text);
                result.Save("invoice_result.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

사례 및 응용 프로그램 사용

계좌 지불 자동화

계좌 데이터를 ERP 또는 회계 플랫폼에 자동으로 입력합니다.

재정적 감사

인증, 감사 및 준수 검사를위한 청구서 필드를 추출합니다.

배치 청구서 디지털화

종이 또는 디지털 청구서의 큰 스택을 기계 읽을 수있는 구조화 된 형식으로 변환합니다.

일반적인 도전과 해결책

도전 1 : 손으로 쓰여진 또는 낮은 품질의 청구서

** 솔루션:** 더 나은 스캔을 사용하거나 명확성을 위해 사전 처리를 조정합니다.

도전 2 : 불일치한 청구서 배열

** 솔루션:** 각 형식에 대한 인식 설정을 설정하고 출력을 확인합니다.

도전 3 : 데이터 통합

** 솔루션:** 데이터베이스, 스파이더 또는 APIs에서 사용하기 위해 JSON으로 수출 결과.

성과 고려 사항

  • 최대 속도를 위한 배치 프로세스
  • 품질 입력을 사용하여 인식을 향상시킵니다.
  • 사용 후 OCR 물건의 사용

모범 사례

  • 금융 시스템에 통합하기 전에 결과를 검증
  • 설정 및 샘플 청구서 세트에 테스트
  • 보안 및 백업 원본 청구서 파일
  • 최고의 결과를 위해 Aspose.OCR의 최신 버전을 사용하십시오.

고급 시나리오

시나리오 1 : 다국어 청구서 추출

settings.Language = Language.German;

시나리오 2 : Excel에 수출 결과

foreach (RecognitionResult result in results)
{
    result.Save("invoice_result.xlsx", SaveFormat.Xlsx);
}

결론

Aspose.OCR Invoice to Text for .NET은 청구서 데이터 추출이 빠르고 정확하며 회계 자동화 준비가되어 있습니다.

더 진보된 사용 및 API 샘플 보기 .NET API 참조를 위한 ASPOSE.OCR .

 한국어