Hogyan lehet szűkíteni a szkennelt dokumentumokat az OCR-hez .NET-ben

Hogyan lehet szűkíteni a szkennelt dokumentumokat az OCR-hez .NET-ben

A szkennelt dokumentumok elkészítésekor Optical Character Recognition (OCR), elengedhetetlen, hogy a felnövekedési képek összpontosítsanak a szöveges nehéz területeken. A szeletelési releváns részei biztosítják az OCR szoftver kivonhatja a szöveg pontosabban és hatékonyan. Aspose.Imaging for .NET biztosítja a szükséges eszközöket a skannált dokumentációk termesztéséhez és előkészítéséhez.

A Cropping Scanned Documents előnyei az OCR-hez

  • Megnövekedett pontosság:- Az OCR erőfeszítéseit a releváns szöveges szakaszokra összpontosítjuk, elkerülve a zajt vagy az irreleváns tartalmat.

  • csökkentett feldolgozási idő:- A képet a feldolgozandó terület minimalizálására növeli, felgyorsítva az OCR folyamatot.

  • Better Text Extraction a következőket tartalmazza**:- Győződjön meg róla, hogy a szöveg megfelelően illeszkedik és jól keretbe kerül az OCR motorokhoz.

Előfeltételek: felállítása Aspose.Imaging

  • Install the Az SDK on your system.
  • Add Aspose.Imaging hozzá a projekthez: dotnet add package Aspose.Imaging
  • Obtain a metered license and configure it using SetMeteredKey().

Lépésről lépésre útmutató a növényi szkennelt dokumentumokhoz az OCR-hez

1. lépés: Állítsa be a Mérett Licencet

Telepítse az Aspose.Imaging funkciókat korlátlan hozzáféréshez.

using Aspose.Imaging;

Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");

2. lépés: Töltse le a szkennelt dokumentumképet

Töltse le a szkennelt dokumentumfájlt, amelyet az OCR előkészítéséhez fel kell szerelni.

string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
    Console.WriteLine($"Loaded scanned document: {inputPath}");
}

3. lépés: Határozza meg a növényterületet

Határozza meg a rektanguláris területet a szöveg körül, amelyet kivonni kell.

var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");

4. lépés: A növényi művelet alkalmazása

Use the Crop() method to extract the required text section from the image.

image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");

5. lépés: mentse meg a képet

Az OCR feldolgozáshoz mentse a kopott képet.

image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");

Elhelyezkedés és használat

  • Dokumentumfeldolgozó rendszerek:- Végezze el az automatizált dokumentum szkennelési rendszereket az OCR képek elkészítéséhez.

  • OCR munkafolyamat integráció:- A növényi dokumentumok átadását megelőzően az OCR motorokhoz gyorsabb és pontosabb szöveges kivonás érdekében.

  • Kiindulási hitelesítés:- Nyissa meg a ragasztott képet annak biztosítása érdekében, hogy a szöveg világosan látható és helyesen kerekítve legyen.

Valódi alkalmazások

  • Jogi és orvosi dokumentumok szkennelése:- Crop scan szerződések vagy orvosi feljegyzések összpontosítani fontos szöveg OCR feldolgozás.

  • Az archív rendszerek:- Készítsünk történelmi dokumentumokat a szövegek kivonására és digitalizálására.

  • Az e-kormányzati szolgáltatások:- Automatizálja a szöveg kivonását a szkennelt formanyomtatványokból vagy alkalmazásokból.

Közös problémák és megoldások

  • A nem megfelelő növénytermesztés területe:- Ensure the Rectangle coordinates match the section with text.

  • Alacsony minőségű képek:- Győződjön meg róla, hogy a szkennelt kép elég nagy felbontással rendelkezik az OCR pontosságához.

  • Fájl engedélyek:- Ellenőrizze, hogy a kimeneti kézikönyveknek megfelelő írásbeli engedélyei vannak.

következtetések

Használatával Aspose.Imaging for .NET, könnyen gyűjti a szkennelt dokumentumokat, hogy összpontosítson a fontos szakaszok OCR feldolgozás, fokozza a pontosság és a hatékonyság. Ez a megoldás ideális automatizált munkafolyamatok a Dokumentumkezelés, jogi rendszerek, és az egészségügyi ellátás.

 Magyar