.NET을 사용하여 Deskew로 OCR에 스캔 된 이미지를 준비하는 방법

.NET을 사용하여 Deskew로 OCR에 스캔 된 이미지를 준비하는 방법

정확한 OCR (Optical Character Recognition)는 완벽하게 조정된 이미지로 시작됩니다. 굴곡 또는 회전 스캔은 OCC의 정확성을 줄이므로 탐색은 중요한 사전 처리 단계입니다. .NET에 대한 Aspose.Imaging은 모든 외부 OCD 도구에서 최상의 결과를 얻기 위해 문서 / 사진을 스트레칭 할 수 있습니다.

현실 세계 문제

OCR 엔진은 잘 조정된 이미지에서 가장 잘 작동합니다. 크로크 스캔은 놓친 캐릭터 또는 텍스트 오류를 일으키는 원인입니다.

솔루션 검토

Aspose.Imaging을 사용하여 .NET에서 스캔된 이미지를 자동으로 해독합니다. PNG 또는 TIFF와 같은 손실없는 형식으로 저장하고, 선택한 OCR 소프트웨어 (Asposa.OCR, Tesseract 등)에 가져올 준비가되어 있습니다.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET에 대한 Aspose.Imaging
  • 스캔 된 문서 또는 이미지 (JPEG, PNG, TIFF 등)
PM> Install-Package Aspose.Imaging

단계별 실행

단계 1 : 스캔 된 이미지를 제거합니다.

using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;

string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";

using (var image = (RasterImage)Image.Load(inputPath))
{
    // Deskew and use white background for optimal OCR results
    image.NormalizeAngle(false, Color.White);
    image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}

단계 2 : 모든 OCR 엔진에 망가진 이미지를 전송합니다.

  • 선호하는 OCR 도구를 사용하여 녹음된 이미지에서 텍스트를 인식합니다.
  • 예제 : 수입 scan_for_ocr_deskewed.png 귀하의 OCR 파이프 라인 또는 소프트웨어 (Aspose.OCR, Tesseract, ABBYY 등)에 들어가십시오.

단계 3 : 검토 및 재검토

  • OCR 결과를 확인하십시오.정확성이 낮은 경우, 배경/바닥 설정 또는 스캔 품질을 조정합니다.
  • 모든 새로운 스캔에 대한 배치 처리를 고려하여 디지털화 작업 흐름을 효율적으로 유지하십시오.

사례 및 응용 프로그램 사용

  • 검색 가능한 텍스트에 대한 파일, 수신, 계약 또는 양식을 디지털화
  • 준수 및 감사를 위한 비즈니스 문서 준비
  • OCR 또는 문서 자동화 파이프 라인에서 정확성을 향상시킵니다.

일반적인 도전과 해결책

** 망가진 이미지는 여전히 OCR 오류를 유발합니다:** 다른 배경 색상, 소음 사전 필터링 또는 더 높은 해상도 스캔을 시도하십시오.

출력 파일이 너무 크다: 투명성이 필요한 경우 압축 TIFF 또는 PNG를 사용하십시오.

** 이미지 형식의 혼합:** OCR 전에 모든 스캔을 손실없는 형태로 정상화합니다.

모범 사례

  • 항상 손실없는 이미지 형식을 사용하여 OCR
  • 참조를 위해 원본 및 처리 된 이미지를 유지
  • 팀을위한 데스크와 디지털화 작업 흐름을 문서화

FAQ

**Q: 하나의 폴더에 모든 이미지를 배치 할 수 있습니까?**A: 예 - 이전 배치 예제에서 보여진 모든 파일 위에이 코드를 롤에 넣으십시오.

**Q: 어떤 배경 색상이 OCR에 가장 잘 작동합니까?**A: 화이트는 텍스트에 가장 안전합니다; 그래픽에 투명하게 사용하거나 문서와 일치합니다.

**Q: 녹음 후 파일을 압축하는 것이 괜찮습니까?**A: 손실없는 압축을 사용하여 OCR 정확도를 줄이는 유물을 피하십시오.

결론

Aspose.Imaging for .NET은 신뢰할 수있는 OCR, 디지털화 및 비즈니스 자동화를위한 필수 요소입니다.당신의 파이프 라인을 깨끗하고 빠르고 정확하게 유지하십시오!더 보기 .NET API 참조를 위한 Aspose.Imaging .

 한국어