Kaip auginti skanytus dokumentus OCR .NET

Kaip auginti skanytus dokumentus OCR .NET

Rengiant skenuojamus dokumentus **Optical Character Recognition (OCR) ** , labai svarbu, kad vaizdai būtų sutelkti dėmesį į tekstinio sunkumo sritis.Nereikalingų dokumentų dalių plovimas užtikrina, jog OCR programinė įranga gali tiksliau ir efektyviau ištraukti tekstą. Aspose.Imaging for .NET suteikia įrankius, reikalingus skanintiems dokumentams pasodinti ir juos paruošti OCR apdorojimui.

Cropping Scanned Dokumentų Nauda OCR

  • Pagerintas tikslumas:- OCR pastangas sutelkia į atitinkamas teksto dalis, vengdama triukšmo ar nesąžiningo turinio.

  • Sumažėjęs apdorojimo laikas:- Auginkite vaizdą, kad sumažintumėte apdorojamo ploto kiekį, pagreitindami OCR procesą.

  • Geriausia teksto ekstrakcija :- Įsitikinkite, kad tekstas yra tinkamai suderintas ir gerai suformuotas OCR varikliams.

Žymos archyvas: Aspose.Imaging

  • Įdiegti į Žymės: SDK Jūsų sistemoje.
  • Pridėti Aspose.Imaging į savo projektą: dotnet add package Aspose.Imaging
  • Gaukite išmatuotą licenciją ir konfigūruokite ją naudojant SetMeteredKey().

Žingsnis po žingsnio OCR skanintų dokumentų auginimo vadovas

1 žingsnis: Įdiegti matuotą licenciją

Įdiegti Aspose.Imaging be apribojimų prieigą prie gręžimo funkcijų.

using Aspose.Imaging;

Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");

2 žingsnis: atsisiųskite skanų dokumentų vaizdą

Atsisiųskite iššifruotą dokumentų failą, kuris turi būti surinktas OCR paruošimui.

string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
    Console.WriteLine($"Loaded scanned document: {inputPath}");
}

3 žingsnis: apibrėžti augalų plotą

Apibrėžkite rektangulinę sritį aplink tekstą, kurį reikia ištraukti.

var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");

4 žingsnis: taikykite auginimo operaciją

Naudokite jį Crop() metodas norint iš nuotraukos ištraukti reikalingą teksto dalį.

image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");

5 žingsnis: išsaugokite sukrėstą vaizdą

Išsaugokite sukauptą vaizdą OCR apdorojimui.

image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");

Įdiegimas ir naudojimas

    • Dokumentų apdorojimo sistemos:- Įdiegti gręžimą automatinėse dokumentų skenavimo sistemose, kad būtų paruošti vaizdai OCR.
  • ** OCR darbo srauto integracija** :- Daržovių dokumentai prieš juos perduodant OCR varikliams greitesnei ir tikslesnei teksto ekstrakcijai.

  • Išleidimo patvirtinimas:- Atidarykite sukurtą vaizdą, kad tekstas būtų aiškiai matomas ir tinkamai išdėstytas.

Realaus pasaulio programos

  • ** Teisės ir medicinos dokumentų skenavimas** :- Augalai skaniami sutartis ar medicininiai įrašai sutelkti dėmesį į svarbų tekstą OCR apdorojimui.

  • • Archyvinės sistemos:- Paruoškite istorinius dokumentus tekstui ištraukti ir skaitmeninti.

  • „E-Government“ paslaugų teikimas:- Automatizuokite teksto ekstrakciją iš skenuojamų formų ar programų.

Bendros problemos ir fiksacijos

  • ** Neteisingas augalų plotas** :- užtikrinti, kad Rectangle koordinatai atitinka skyrių tekstą.

  • Mažos kokybės nuotraukos:- Įsitikinkite, kad skenuojamas vaizdas turi pakankamai aukštą rezoliuciją OCR tikslumui.

  • Įrašų leidimai:- Įsitikinkite, kad išleidimo katalogai turi atitinkamas rašymo leidimus.

Conclusion

Naudojant Aspose.Imaging .NET , galite lengvai surinkti skenuojamus dokumentus, kad sutelktumėte dėmesį į svarbius OCR apdorojimo skyrius, pagerintą tikslumą ir efektyvumą.Šis sprendimas idealiai tinka automatiniams dokumentų valdymo, teisinės sistemos ir sveikatos priežiūros darbo srautams.

 Lietuvių