.NET에서 OCR를 위해 스캔 된 문서를 재배하는 방법
**Optical Character Recognition (OCR)**에 대한 스캔 된 문서를 준비할 때, 텍스트 무거운 영역에 초점을 맞추기 위해 그림을 묘사하는 것이 필수적입니다. 문서의 무관심 부분을 묘사하면 OCR 소프트웨어가 텍스트를 더 정확하고 효율적으로 추출 할 수 있도록 보장합니다. Aspose.Imaging for .NET는 스캔 된 문서를 묘사하고 OCR 처리에 준비하는 데 필요한 도구를 제공합니다.
OCR에 대한 크로핑 스캔 된 문서의 이점
더 나은 정확성:- OCR의 노력은 관련 텍스트 섹션에 초점을 맞추고 소음이나 관련이없는 콘텐츠를 피합니다.
제작 시간을 줄이기:- OCR 프로세스를 가속화하여 처리해야 할 영역을 최소화하기 위해 이미지를 심습니다.
더 나은 텍스트 추출:- 텍스트가 OCR 엔진에 적절하게 조정되고 잘 프레임되어 있는지 확인합니다.
원칙 : ASPOSE 설정.Imaging
- 설치할 수 있는 넷 SDK 당신의 시스템에
- 당신의 프로젝트에 Aspose.Imaging을 추가하십시오 :
dotnet add package Aspose.Imaging
- 측정된 라이센스를 얻고 사용하여 설정합니다.
SetMeteredKey()
.
OCR에 대한 식물 검사 문서에 대한 단계별 가이드
단계 1: 측정된 라이센스를 설정합니다.
Aspose.Imaging을 설정하여 묘목 기능에 대한 무제한 액세스를 제공합니다.
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");
단계 2: 스캔 된 문서 이미지를 업로드
OCR 준비를 위해 쌓아야 할 스캔 된 문서 파일을 업로드합니다.
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"Loaded scanned document: {inputPath}");
}
단계 3 : 식물 영역을 정의하십시오
추출해야하는 텍스트 주위의 직경 영역을 정의합니다.
var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");
단계 4 : 식물 작업을 적용
사용하시기 바랍니다 Crop()
그림에서 필요한 텍스트 섹션을 추출하는 방법.
image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");
5단계: 크로프 된 이미지를 저장합니다.
OCR 처리에 대한 쌓인 이미지를 저장합니다.
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");
배치 및 사용
문서 처리 시스템:- OCR에 대한 이미지를 준비하기 위해 자동 문서 스캔 시스템에서 묘목을 구현합니다.
OCR 작업 흐름 통합:- 식물 문서를 OCR 엔진에 전달하기 전에 더 빠르고 정확한 텍스트 추출을 위해.
출력 승인:- 녹은 이미지를 열어 텍스트가 명확하게 볼 수 있고 올바르게 프레임되어 있는지 확인합니다.
현실 세계 응용 프로그램
법적 및 의료 문서 검사:- 식물 스캔 계약 또는 의료 기록은 OCR 처리에 중요한 텍스트에 초점을 맞추기 위해.
아카이브 시스템:- 텍스트 추출 및 디지털화에 대한 역사적 문서를 준비하십시오.
전자 관리 서비스:- 스캔된 양식이나 응용 프로그램에서 텍스트 추출을 자동화합니다.
일반적인 문제와 고정
잘못된 식물 영역:- 보장할 수 있는
Rectangle
코디네이터는 섹션과 텍스트와 일치합니다.낮은 품질의 사진:- 스캔된 이미지가 OCR 정확성을 위해 충분히 높은 해상도를 가지고 있는지 확인합니다.
파일 허가:- 출력 디렉토리가 적절한 글쓰기 허가를 가지고 있는지 확인합니다.
결론
Aspose.Imaging for .NET를 사용하면 스캔 된 문서를 쉽게 수집하여 OCR 처리, 정확성 및 효율성을 향상시키는 중요한 섹션에 초점을 맞출 수 있습니다.이 솔루션은 문서 관리, 법률 시스템 및 의료 분야의 자동 작업 흐름에 이상적입니다.