Hogyan lehet szűkíteni a szkennelt dokumentumokat az OCR-hez .NET-ben
A szkennelt dokumentumok elkészítésekor Optical Character Recognition (OCR), elengedhetetlen, hogy a felnövekedési képek összpontosítsanak a szöveges nehéz területeken. A szeletelési releváns részei biztosítják az OCR szoftver kivonhatja a szöveg pontosabban és hatékonyan. Aspose.Imaging for .NET biztosítja a szükséges eszközöket a skannált dokumentációk termesztéséhez és előkészítéséhez.
A Cropping Scanned Documents előnyei az OCR-hez
Megnövekedett pontosság:- Az OCR erőfeszítéseit a releváns szöveges szakaszokra összpontosítjuk, elkerülve a zajt vagy az irreleváns tartalmat.
csökkentett feldolgozási idő:- A képet a feldolgozandó terület minimalizálására növeli, felgyorsítva az OCR folyamatot.
Better Text Extraction a következőket tartalmazza**:- Győződjön meg róla, hogy a szöveg megfelelően illeszkedik és jól keretbe kerül az OCR motorokhoz.
Előfeltételek: felállítása Aspose.Imaging
- Install the Az SDK on your system.
- Add Aspose.Imaging hozzá a projekthez:
dotnet add package Aspose.Imaging
- Obtain a metered license and configure it using
SetMeteredKey()
.
Lépésről lépésre útmutató a növényi szkennelt dokumentumokhoz az OCR-hez
1. lépés: Állítsa be a Mérett Licencet
Telepítse az Aspose.Imaging funkciókat korlátlan hozzáféréshez.
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");
2. lépés: Töltse le a szkennelt dokumentumképet
Töltse le a szkennelt dokumentumfájlt, amelyet az OCR előkészítéséhez fel kell szerelni.
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"Loaded scanned document: {inputPath}");
}
3. lépés: Határozza meg a növényterületet
Határozza meg a rektanguláris területet a szöveg körül, amelyet kivonni kell.
var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");
4. lépés: A növényi művelet alkalmazása
Use the Crop()
method to extract the required text section from the image.
image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");
5. lépés: mentse meg a képet
Az OCR feldolgozáshoz mentse a kopott képet.
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");
Elhelyezkedés és használat
Dokumentumfeldolgozó rendszerek:- Végezze el az automatizált dokumentum szkennelési rendszereket az OCR képek elkészítéséhez.
OCR munkafolyamat integráció:- A növényi dokumentumok átadását megelőzően az OCR motorokhoz gyorsabb és pontosabb szöveges kivonás érdekében.
Kiindulási hitelesítés:- Nyissa meg a ragasztott képet annak biztosítása érdekében, hogy a szöveg világosan látható és helyesen kerekítve legyen.
Valódi alkalmazások
Jogi és orvosi dokumentumok szkennelése:- Crop scan szerződések vagy orvosi feljegyzések összpontosítani fontos szöveg OCR feldolgozás.
Az archív rendszerek:- Készítsünk történelmi dokumentumokat a szövegek kivonására és digitalizálására.
Az e-kormányzati szolgáltatások:- Automatizálja a szöveg kivonását a szkennelt formanyomtatványokból vagy alkalmazásokból.
Közös problémák és megoldások
A nem megfelelő növénytermesztés területe:- Ensure the
Rectangle
coordinates match the section with text.Alacsony minőségű képek:- Győződjön meg róla, hogy a szkennelt kép elég nagy felbontással rendelkezik az OCR pontosságához.
Fájl engedélyek:- Ellenőrizze, hogy a kimeneti kézikönyveknek megfelelő írásbeli engedélyei vannak.
következtetések
Használatával Aspose.Imaging for .NET, könnyen gyűjti a szkennelt dokumentumokat, hogy összpontosítson a fontos szakaszok OCR feldolgozás, fokozza a pontosság és a hatékonyság. Ez a megoldás ideális automatizált munkafolyamatok a Dokumentumkezelés, jogi rendszerek, és az egészségügyi ellátás.