Aspose.OCR을 사용하여 양식에서 데이터 입력을 자동화하는 방법

Aspose.OCR을 사용하여 양식에서 데이터 입력을 자동화하는 방법

종이 양식, 쿼리 또는 설문 조사에서 정보를 추출하는 것은 고전적인 데이터 입력 버튼입니다. .NET을 위한 Aspose.OCR을 사용하면 스캔이나 사진에서 형식 데이터를 디지털화하여 오류를 줄이고 구조되지 않은 문서를 구조화되고 편집 가능한 데이터로 변환할 수 있습니다.

현실 세계 문제

수동 형식 데이터 입력은 느리고 비싸며 오류에 매우 취약합니다 - 특히 대규모 조직, 연구 또는 물류.수동 작성, 다양한 배열 및 혼합 필드 유형은 강력한 OCR 도구없이 자동화를 도전합니다.

솔루션 검토

Aspose.OCR for .NET은 융통성있는 인식 설정을 제공하여 양식, 프로세스 체크 상자 및 출력 구조화 된 결과에서 인쇄 및 수동으로 작성된 텍스트를 추출합니다 - 비즈니스, 건강 관리, 인력, 교육 및 기타에 이상적입니다.

원칙

시작하기 전에, 당신이 가지고 있는지 확인하십시오 :

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • 기본 C# 경험
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2 : 양식을 스캔하거나 사진을 찍으십시오.

양식 이미지를 준비하십시오 (JPEG, PNG, PDF 또는 TIFF). 배치 추출을 위해 여러 파일을 추가할 수 있습니다.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

단계 3: 인식 설정을 설정

언어, 레이아웃 및 (필요한 경우) 수동 작성 탐지에 대한 설정 조정.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

단계 4: 데이터 추출 프로세스를 실행

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5단계: 디지털 데이터 수출 또는 사용

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

단계 6 : 오류 처리 추가

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

단계 7 : 레이아웃 및 수동 작성을 최적화

  • 수동으로 작성된 필드에서는 더 높은 DPI 스캔을 사용하고 언어 설정을 조정합니다.
  • 테이블 양식을 위한 DetectAreasMode.TABLE 또는 다양한 배열을 위한 DOCUMENT 사용
  • 샘플 형식으로 테스트하여 톤 설정
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

단계 8 : 완전한 예제

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

사례 및 응용 프로그램 사용

건강과 HR

환자 수신, 직업 응용 프로그램 또는 설문 조사에 대한 양식 데이터를 추출하고 디지털화합니다.

연구 및 교육

더 빠른 분석을 위해 자동 설문 조사 및 조사 처리.

물류 및 비즈니스

배달 노트, 검사 양식 또는 인벤토리 체크리스트를 디지털화합니다.

일반적인 도전과 해결책

도전 1 : 손으로 쓰여진 또는 낮은 품질의 필드

** 솔루션:** 고품질 스캔을 사용하고 수동 작성에 대한 인식 설정을 조정합니다.

도전 2 : 불규칙한 형식 레이아웃

솔루션: 복잡한 레이아웃을 위해 문서 모드를 사용하고 샘플을 테스트합니다.

도전 3 : 배치 추출

** 솔루션:** 대량 양식에 대 한 디렉토리 기반 배치 처리 사용.

성과 고려 사항

  • 속도와 규모를 위한 배치 프로세스
  • 사용 후 OCR 물건을 제공합니다.
  • 통합 전에 출력 확인

모범 사례

  • 자동화 전에 정확성을 위한 디지털 데이터 검토
  • 각 양식 템플릿 유형에 대한 톤 설정
  • 아카이브 원본 검토
  • 기능 개선을 위해 Aspose.OCR을 정기적으로 업데이트합니다.

고급 시나리오

시나리오 1 : 양식에서 수동 글쓰기를 추출

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

시나리오 2 : 데이터베이스 수입을 위해 JSON에 수출

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

결론

Aspose.OCR for .NET 자동화는 데이터 추출을 형성합니다 - 수동 입력을 제거하고 비즈니스, 연구 또는 관리 작업 흐름을 가속화합니다.

더 많은 고급 사용 및 코드 샘플을 보세요 .NET API 참조를 위한 ASPOSE.OCR .

 한국어