Како припремити скениране слике за ОЦР са Дескеу користећи .NET

Како припремити скениране слике за ОЦР са Дескеу користећи .NET

Прецизна ОЦР (оптичка препознавање карактера) почиње са савршено усклађеним сликама. Скеирани или ротирани скени смањују прецизност ОКР-а, тако да је дескеирање критичан корак препроцесирања.

Реал светски проблем

ОЦР мотори најбоље раде на добро усаглашеним сликама. Цроокирани скени узрокују пропуштене ликове или текстуалне грешке.

Преглед решења

Користите Aspose.Imaging за .NET да бисте аутоматски отклонили скениране слике. сачувате их у безгубном формату као што су ПНГ или ТИФФ, спремни за увоз у софтвер ОЦР по избору (Аспосе.ОКР, Тесеракт, итд.).

Принципи

  • Visual Studio 2019 или касније
  • .NET 6.0 или новији (или .Net Framework 4.6.2+)
  • Aspose.Imaging za .NET od NuGet
  • Скенирани документ или слика (ЈПЕГ, ПНГ, ТИФФ, итд.)
PM> Install-Package Aspose.Imaging

Корак по корак спровођење

Корак 1: Отклоните скенирану слику

using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;

string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";

using (var image = (RasterImage)Image.Load(inputPath))
{
    // Deskew and use white background for optimal OCR results
    image.NormalizeAngle(false, Color.White);
    image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}

Корак 2: Пребаците десквиране слике на било који ОЦР мотор

  • Користите свој омиљени ОЦР алат да бисте препознали текст из слике.
  • Пример: увоза scan_for_ocr_deskewed.png у вашу ОЦР цев или софтвер (Аспозе.ОКР, Тесеракт, АББИИ, итд.).

Корак 3: Преглед и рефин

  • Проверите резултате ОЦР-а. Ако је тачност ниска, прилагодите подешавања и/или квалитет скенирања.
  • Размислите о баццх-процесу за све нове скене како би ваш радни ток дигитализације био ефикасан.

Коришћење случајева и апликација

  • Дигитализација архива, прихода, уговора или обрасца за претраживачки текст
  • Припрема пословних докумената за поштовање и ревизију
  • Побољшање прецизности у било којој ОЦР или цеви за аутоматизацију докумената

Заједнички изазови и решења

Скривене слике и даље узрокују ОЦР грешке: Покушајте различите боје позадине, префилтрирање за буку или скенирање високе резолуције.

Излазни датотеке су превелике: Користите ТИФФ са компресијом, или ПНГ ако је потребна транспарентност.

Микс формата слике: Нормалишете све скене у без губитака формат пре ОЦР.

Најбоља пракса

  • Увек користите формате слике без губитака за ОЦР
  • Сачувајте оригиналне и обрађене слике за референце
  • Документирајте свој радни ток и дигитализацију за тим

FAQ

**Q: Da li mogu da sačuvam sve slike u jednom dosjeu?**Odgovor: Da, stavite ovaj kod u krug preko svih datoteka, kao što je prikazano u prethodnim primerima.

**Q: Која боја позадине најбоље функционише за ОЦР?**Одговор: Бела је најсигурнија за текст; користите транспарентну за графику, или одговарају вашем документу.

**П: Да ли је у реду да компресирате датотеке након отварања?**А: Користите компресију без губитака како бисте избегли артифакте који смањују ОЦР тачност.

Закључак

Имитање за .NET је неопходно за поуздану ОЦР, дигитализацију и пословну аутоматизацију. Држите свој цев чист, брз и тачан! Aspose.Imaging za .NET API Reference .

 Српски