Kuinka kasvaa skannattuja asiakirjoja OCR: ssä .NET: ssä

Kuinka kasvaa skannattuja asiakirjoja OCR: ssä .NET: ssä

Kun valmistellaan skannattuja asiakirjoja Optical Character Recognition (OCR) varten, on välttämätöntä viljellä kuvia keskittymään tekstipainoisiin alueisiin. dokumentin merkityksettömien osien leikkaaminen varmistaa, että OCR-ohjelmisto voi poistaa tekstiä tarkemmin ja tehokkaammin. Aspose.Imaging for .NET tarjoaa tarvittavat työkalut skannaettujen asiakkuuksien viljelemiseen ja niiden valmistelemiseen OKR-käsittelyyn.

OCR: n skannattujen asiakirjojen hyödyt

  • Parannettu tarkkuus:- Keskity OCR:n ponnisteluihin asiaankuuluviin tekstiosastoihin, välttäen melua tai merkityksetöntä sisältöä.

  • Vähentynyt käsittelyaika:- Kasvaa kuvaa minimoimaan käsiteltävä alue, nopeuttamalla OCR-prosessia.

  • Parempi tekstiä tuotanto:- Varmista, että teksti on asianmukaisesti yhdenmukaistettu ja hyvin muotoiltu OCR-moottoreille.

Edellytykset: Aseta Aspose.Imaging

  • Install the Netti SDK on your system.
  • Lisää Aspose.Imaging projektillesi: dotnet add package Aspose.Imaging
  • Obtain a metered license and configure it using SetMeteredKey().

Vaiheittainen opas viljelyskannattujen asiakirjojen OCR

Vaihe 1: Määritä mitattu lisenssi

Aseta Aspose.Imaging rajoittamattoman pääsyn kaivosominaisuuksiin.

using Aspose.Imaging;

Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");

Vaihe 2: Lataa skannattu dokumenttikuva

Lataa skannattu asiakirja tiedosto, joka on kerättävä OCR valmisteluun.

string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
    Console.WriteLine($"Loaded scanned document: {inputPath}");
}

Vaihe 3: Määritä viljelyalue

Määritä tekstiä ympäröivän rektangulaarisen alueen, joka on poistettava.

var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");

Vaihe 4: Käytä kasvioperaatiota

Use the Crop() method to extract the required text section from the image.

image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");

Vaihe 5: Tallenna kuvan

Säilytä kootettu kuva OCR-käsittelyssä.

image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");

Käyttö ja käyttöönotto

  • Tietojenkäsittelyjärjestelmät:- Käytetään kaivaa automaattisiin asiakirjojen skannausjärjestelmiin OCR: n kuvien valmistelemiseksi.

  • OCR Workflow Integraatio:- Kasvien asiakirjat ennen niiden siirtämistä OCR-moottoreille nopeammin ja tarkemmin tekstiä.

  • Tuonnin validointi:- Avaa leikattu kuva varmistaaksesi, että teksti on selkeästi näkyvissä ja järjestetty oikein.

Reaalimaailman sovellukset

  • Laki- ja lääketieteellinen asiakirjan skannaus:- Kasvit skannattuja sopimuksia tai lääketieteellisiä asiakirjoja keskittyä tärkeä teksti OCR käsittelyn.

  • Arkkitehtuurin järjestelmät:- Valmista historialliset asiakirjat tekstien hankkimiseen ja digitalisointiin.

  • Sähköisen hallinnon palvelut:- Automaattinen tekstien poisto skannatuista lomakkeista tai sovelluksista.

Yhteiset ongelmat ja korjaukset

  • Epäoikeudenmukainen viljelyalue:- Ensure the Rectangle coordinates match the section with text.

  • Alhainen kuvanlaatu:- Varmista, että skannatulla kuvalla on riittävän korkea resoluutio OCR: n tarkkuudelle.

  • Tiedostojen käyttöoikeudet:- Varmista, että tuotantodirektiiveillä on asianmukaiset kirjoituslupat.

johtopäätöksiä

Käyttämällä Aspose.Imaging for .NET voit helposti kerätä skannattuja asiakirjoja keskittyä tärkeisiin OCR-käsittelyn osiin, parantaa tarkkuutta ja suorituskykyä. Tämä ratkaisu on ihanteellinen automaattisiin työnkulkuihin dokumentinhallinnassa, oikeusjärjestelmissä ja terveydenhuollossa.

 Suomi