Kā audzēt skenētus dokumentus OCR .NET

Kā audzēt skenētus dokumentus OCR .NET

Izgatavojot skenētus dokumentus **Optical Character Recognition (OCR) ** , ir svarīgi, lai attēlus sadalītu, koncentrējoties uz teksta smagajām zonām.Skrāpēšana neatbilstīgām dokumenta daļām nodrošina, ka OCR programmatūra var precīzāk un efektīvāk izrakstīt tekstu. Aspose.Imaging for .NET sniedz nepieciešamos rīkus skanētiem dokumentiem un sagatavo tos OCR apstrādei.

Krāpšanas skenēto dokumentu priekšrocības OCR

  • uzlabota precizitāte:- Uzskatiet OCR centienus attiecīgajām teksta sadaļām, izvairieties no trokšņa vai neatbilstoša satura.

  • samazināts apstrādes laiks:- Audzējiet attēlu, lai samazinātu apdari, kas jāapstrādā, paātrinot OCR procesu.

  • ** Labāka teksta ekstrakcija** :- Pārliecinieties, ka teksts ir pienācīgi saskaņots un labi izstrādāts OCR motoriem.

Priekšnoteikumi: Uzstādīt Aspose.Imaging

  • Instalējiet Netaisnība SDK uz jūsu sistēmu.
  • Pievienojiet Aspose.Imaging savā projektā: dotnet add package Aspose.Imaging
  • Iegūstiet mērīto licences un konfigurējiet to, izmantojot SetMeteredKey().

Pakāpeniski ceļvedis uz augu skenētiem dokumentiem OCR

1. solis: Iestatīt Mērētās licences

Iestatīt Aspose.Imaging bez ierobežojumiem piekļuvi grauzdēšanas funkcijām.

using Aspose.Imaging;

Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");

2. solis: Lejupielādēt skenēto dokumentu attēlu

Lejupielādējiet skenēto dokumentu failu, kas jākrāpē OCR sagatavošanai.

string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
    Console.WriteLine($"Loaded scanned document: {inputPath}");
}

3. solis: nosaka augu zonu

Nosakiet taisnstūra zonu ap teksta, kas jāizņem.

var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");

4. solis: Ievietojiet augu operāciju

Izmantojiet Crop() metodi, lai no attēla iegūtu nepieciešamo teksta daļu.

image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");

5. solis: glabāt krēpu attēlu

Saglabājiet iegremdēto attēlu OCR apstrādei.

image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");

Iestāde un izmantošana

  • ** Dokumentu apstrādes sistēmas** :- Ieviest grauzdēšanu automatizētajās dokumentu skenēšanas sistēmās, lai sagatavotu attēlus OCR.

  • OCR Darba plūsmas integrācija :- Augu dokumentus pirms to pārsūtīšanas uz OCR motoriem, lai ātrāk un precīzāk teksta ekstrakciju.

  • Izveidošanas validācija:- Atveriet uzkrāto attēlu, lai pārliecinātos, ka teksts ir skaidri redzams un pareizi veidots.

Reālā pasaules pieteikumi

  • ** Juridisko un medicīnisko dokumentu skenēšana** :- Augu skenēti līgumi vai medicīnas ieraksti, lai koncentrētu uzmanību uz svarīgu tekstu OCR apstrādei.

  • Arhitektūras sistēma:- Sagatavojiet vēstures dokumentus teksta ekstrakcijai un digitalizācijai.

    • E-pārvaldes pakalpojumi ir:- Automatizējiet teksta ekstrakciju no skenētiem veidlapām vai lietojumprogrammām.

Kopīgas problēmas un fiksācijas

  • ** Nepareiza augu platība** :- Pārliecinieties par Rectangle Koordinācijas atbilst sadaļai ar tekstu.

    • Nedaudz kvalitatīvas fotogrāfijas:- Pārliecinieties, ka skenētajā attēlam ir pietiekami augsta izšķirtspēja, lai nodrošinātu OCR precizitāti.
  • **File atļaujas *:- Pārliecinieties, ka produkcijas direktorijām ir atbilstošas rakstīšanas atļaujas.

Conclusion

Izmantojot Aspose.Imaging for .NET , jūs varat viegli audzēt skenētus dokumentus, lai koncentrētu uzmanību uz svarīgām OCR apstrādes daļām, uzlabojot precizitāti un efektivitāti.Šis risinājums ir ideāls automatizētiem darba plūsmām dokumentu pārvaldībā, juridiskajās sistēmās un veselības aprūpes jomā.

 Latviski