Kā sagatavot skenētos attēlus OCR ar Deskew, izmantojot Aspose.Imaging .NET
Precīzs OCR (Optical Character Recognition) sākas ar pilnīgi saskaņotiem attēliem. atgrieztos vai rotētos skanējumus samazina OKR precizitāti, tāpēc atslēgšana ir kritisks priekšapstrādes posms. Aspose.Imaging for .NET ļauj jums iztīrīt dokumentus / fotogrāfijas, lai iegūtu vislabākos rezultātus jebkurā ārējā OCR rīcībā.
Reālā pasaules problēma
OCR dzinēji vislabāk darbojas uz labi saskaņotiem attēliem. Crooked skenēšana izraisa pazudušus rakstzīmes vai teksta kļūdas. Manual stingrība ir pārāk lēna lielām partijām.
Risinājumu pārskats
Izmantojiet Aspose.Imaging .NET, lai automātiski izslēgtu skenētos attēlus. glabāt tos bez zaudējumiem formātā, piemēram, PNG vai TIFF, gatavs importēt jūsu OCR programmatūru izvēlnē (ASPOSE.OCR, Tesseract, utt.).
Prerequisites
- Visual Studio 2019 vai vēlāk
- .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
- Aspose.Imaging par .NET no NuGet
- Skanēts dokuments vai attēls (JPEG, PNG, TIFF utt.)
PM> Install-Package Aspose.Imaging
Step-by-step īstenošana
1. solis: izslēdziet skenēto attēlu
using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;
string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";
using (var image = (RasterImage)Image.Load(inputPath))
{
// Deskew and use white background for optimal OCR results
image.NormalizeAngle(false, Color.White);
image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}
2. solis: Pārsūtīt izslēgto attēlu jebkurā OCR motora
- Izmantojiet savu preferēto OCR rīku, lai atpazītu tekstu no izslēgta attēla.
- Piemērs: imports
scan_for_ocr_deskewed.png
Jūsu OCR caurulē vai programmatūrā (Aspose.OCR, Tesseract, ABBYY utt.).
3. solis: Pārskats un pārskatīšana
- Pārbaudiet OCR rezultātus. ja precizitāte ir zema, pielāgojiet izkārnījumu / aizmugures iestatījumus vai skenēšanas kvalitāti.
- Apsveriet visu jauno skenēšanu, lai jūsu digitalizācijas darba plūsma būtu efektīva.
Izmantojiet gadījumus un pieteikumus
- Digitalizēt arhīvus, saņemumus, līgumus vai veidlapas meklējams teksts
- Biznesa dokumentu sagatavošana atbilstības un revīzijas vajadzībām
- Palielināt precizitāti jebkurā OCR vai dokumentu automatizācijas caurulē
Kopīgi izaicinājumi un risinājumi
Aizmirsti attēli joprojām izraisa OCR kļūdas: Izmēģiniet dažādas fona krāsas, iepriekš filtrēt trokšņa vai augstākas izšķirtspējas skenēšanu.
Izceļošanas faili ir pārāk lieli: Izmantojiet TIFF ar kompresiju vai PNG, ja nepieciešama pārredzamība.
Mix attēla formātus: Normalizējiet visus skenējumus bez zaudējumiem formātā pirms OCR.
Labākās prakses
- Vienmēr izmantojiet bez zaudējumiem attēla formātus OCR
- saglabāt oriģinālus un apstrādātus attēlus atsauces vajadzībām
- Dokumentējiet savu desku un digitalizācijas darba plūsmu komandai
FAQ
**Q: Vai es varu atskaņot visus attēlus vienā mapē?**A: Jā – ievietojiet šo kodu caurumā visās failās, kā parādīts iepriekšējā batch piemēros.
**Q: Kāds fona krāsa darbojas vislabāk OCR?**A: Balts ir drošākais tekstam; izmantojiet caurspīdīgu grafiku vai atbilst jūsu dokumentam.
**Q: Vai tas ir OK, lai kompresētu failus pēc deskeva?**A: Izmanto bez zaudējumiem kompresiju, lai izvairītos no objektiem, kas samazina OCR precizitāti.
Conclusion
Atjaunošana ar Aspose.Imaging for .NET ir nepieciešama uzticama OCR, digitalizācija un biznesa automācija.Uzglabāt savu cauruļvadu tīru, ātru un precīzu! Aspose.Imaging par .NET API atsauci .