Kuinka kasvaa skannattuja asiakirjoja OCR: ssä .NET: ssä
Kun valmistellaan skannattuja asiakirjoja Optical Character Recognition (OCR) varten, on välttämätöntä viljellä kuvia keskittymään tekstipainoisiin alueisiin. dokumentin merkityksettömien osien leikkaaminen varmistaa, että OCR-ohjelmisto voi poistaa tekstiä tarkemmin ja tehokkaammin. Aspose.Imaging for .NET tarjoaa tarvittavat työkalut skannaettujen asiakkuuksien viljelemiseen ja niiden valmistelemiseen OKR-käsittelyyn.
OCR: n skannattujen asiakirjojen hyödyt
Parannettu tarkkuus:- Keskity OCR:n ponnisteluihin asiaankuuluviin tekstiosastoihin, välttäen melua tai merkityksetöntä sisältöä.
Vähentynyt käsittelyaika:- Kasvaa kuvaa minimoimaan käsiteltävä alue, nopeuttamalla OCR-prosessia.
Parempi tekstiä tuotanto:- Varmista, että teksti on asianmukaisesti yhdenmukaistettu ja hyvin muotoiltu OCR-moottoreille.
Edellytykset: Aseta Aspose.Imaging
- Install the Netti SDK on your system.
- Lisää Aspose.Imaging projektillesi:
dotnet add package Aspose.Imaging
- Obtain a metered license and configure it using
SetMeteredKey()
.
Vaiheittainen opas viljelyskannattujen asiakirjojen OCR
Vaihe 1: Määritä mitattu lisenssi
Aseta Aspose.Imaging rajoittamattoman pääsyn kaivosominaisuuksiin.
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");
Vaihe 2: Lataa skannattu dokumenttikuva
Lataa skannattu asiakirja tiedosto, joka on kerättävä OCR valmisteluun.
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"Loaded scanned document: {inputPath}");
}
Vaihe 3: Määritä viljelyalue
Määritä tekstiä ympäröivän rektangulaarisen alueen, joka on poistettava.
var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");
Vaihe 4: Käytä kasvioperaatiota
Use the Crop()
method to extract the required text section from the image.
image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");
Vaihe 5: Tallenna kuvan
Säilytä kootettu kuva OCR-käsittelyssä.
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");
Käyttö ja käyttöönotto
Tietojenkäsittelyjärjestelmät:- Käytetään kaivaa automaattisiin asiakirjojen skannausjärjestelmiin OCR: n kuvien valmistelemiseksi.
OCR Workflow Integraatio:- Kasvien asiakirjat ennen niiden siirtämistä OCR-moottoreille nopeammin ja tarkemmin tekstiä.
Tuonnin validointi:- Avaa leikattu kuva varmistaaksesi, että teksti on selkeästi näkyvissä ja järjestetty oikein.
Reaalimaailman sovellukset
Laki- ja lääketieteellinen asiakirjan skannaus:- Kasvit skannattuja sopimuksia tai lääketieteellisiä asiakirjoja keskittyä tärkeä teksti OCR käsittelyn.
Arkkitehtuurin järjestelmät:- Valmista historialliset asiakirjat tekstien hankkimiseen ja digitalisointiin.
Sähköisen hallinnon palvelut:- Automaattinen tekstien poisto skannatuista lomakkeista tai sovelluksista.
Yhteiset ongelmat ja korjaukset
Epäoikeudenmukainen viljelyalue:- Ensure the
Rectangle
coordinates match the section with text.Alhainen kuvanlaatu:- Varmista, että skannatulla kuvalla on riittävän korkea resoluutio OCR: n tarkkuudelle.
Tiedostojen käyttöoikeudet:- Varmista, että tuotantodirektiiveillä on asianmukaiset kirjoituslupat.
johtopäätöksiä
Käyttämällä Aspose.Imaging for .NET voit helposti kerätä skannattuja asiakirjoja keskittyä tärkeisiin OCR-käsittelyn osiin, parantaa tarkkuutta ja suorituskykyä. Tämä ratkaisu on ihanteellinen automaattisiin työnkulkuihin dokumentinhallinnassa, oikeusjärjestelmissä ja terveydenhuollossa.