Како узгајати скениране документе за ОЦР у .NET-у
Приликом припреме скенираних докумената за оптичко препознавање карактера (ОЦР), неопходно је да се слике узгајају како би се фокусирале на тешке области текста. Цропирање нерелевантних делова документа осигурава да софтвер ОКР може да извуче текст прецизније и ефикасније. Аспозе.Имање за .НЕТ пружа алате неопходне за сакупљање скандираних документи и припрема их за обраду ОПР-а.
Предности Цропинг скенираних докумената за ОЦР
Побољшана прецизност:- ОЦР напори се фокусирају на релевантне текстуалне секције, избегавајући буку или нерелевантан садржај.
Смањено време обраде:- Посадити слику како би се минимизирала површина која ће бити обрађена, убрзавајући процес ОЦР-а.
Побољшана текстуална екстракција:- Уверите се да је текст правилно усклађен и добро оквиран за ОЦР моторе.
Претходни Чланак Успостављање асфозе.Имање
- Install the .NET СДК on your system.
- Додајте Aspose.Imaging у свој пројекат:
dotnet add package Aspose.Imaging
- Obtain a metered license and configure it using
SetMeteredKey()
.
Корак по корак водич за сакупљање скенираних докумената за ОЦР
Корак 1: Конфигурисање Метрисане лиценце
Инсталирајте Aspose.Imaging за неограничен приступ функцијама копања.
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");
Корак 2: Преузмите скенирану слику документа
Преузмите скенирани документ датотеку који треба да буде сакупљен за ОЦР припрему.
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"Loaded scanned document: {inputPath}");
}
Корак 3: Опремите површину узгоја
Опремите правоугаону површину око текста који треба извући.
var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");
Корак 4: Применити операцију узгоја
Use the Crop()
method to extract the required text section from the image.
image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");
Корак 5: Сачувајте украшену слику
Сачувајте украшену слику за ОЦР обраду.
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");
Унапређење и коришћење
Системи за обраду докумената:- Увођење гравирања у аутоматским системима за скенирање докумената како би се припремиле слике за ОЦР.
ОЦР Интеграција радног тока:- Документи за жетву пре него што их пренесете на ОЦР моторе за бржу и прецизнију текстуалну екстракцију.
Излазна валидација:- Отворите сакупљену слику како би се осигурало да је текст јасно видљив и правилно оквиран.
Реал-Свет апликације
Правни и медицински скенирање докумената:- Crop скенирани уговори или медицински записи да се фокусирају на важан текст за ОЦР обраду.
Архивални систем:- Припремите историјске документе за екстракцију текста и дигитализацију.
Услуге електронске управе:- Аутоматизујете извлачење текста из скенираних обрасца или апликација.
Уобичајени проблеми и фиксирања
Неправилна површина узгоја:- Ensure the
Rectangle
coordinates match the section with text.Нискоквалитетне слике:- Уверите се да скенирана слика има довољно високу резолуцију за ОЦР тачност.
Дозвољавање датотеке:- Проверите директоријуме излаза имају одговарајуће дозволе за писање.
Закључак
Користећи Aspose.Imaging за .NET, лако можете сакупљати скениране документе како бисте се фокусирали на важне секције за обраду ОЦР-а, побољшавајући тачност и ефикасност.Ово решење је идеално за аутоматске радне токове у управљању документима, правним системима и здравственом осигурању.