Kuinka etsiä ja verrata tekstiä kuvissa Aspose.OCR: n kanssa

Kuinka etsiä ja verrata tekstiä kuvissa Aspose.OCR: n kanssa

Kuvien sisällä olevien tekstien etsiminen tai vertaileminen on välttämätöntä vaatimustenmukaisuuden, digitaalisen arkiston ja automaattisen luokittelun kannalta. Aspose.OCR Image Text Finder for .NET antaa sinulle mahdollisuuden tunnistaa, etsiä ja verrata kuvan tekstiä tarkasti - useiden käyttötapausten kautta PII-tunnistuksesta lailliseen tarkasteluun.

Reaalimaailman ongelma

Yritykset tarvitsevat usein hakea herkkää sisältöä, tarkistaa allekirjoituksia tai verrata tekstiä erilaisten kuvan tiedostojen versioiden välillä. Manuaaliset tarkastukset ovat hitaita ja epäluotettavia, erityisesti suurille digitaalisille arkistoille tai asiakirjojen joukkoille.

Ratkaisun yleiskatsaus

Aspose.OCR: n avulla voit etsiä tiettyjä tekstiä tai malleja (käyttämällä sarjoja tai regex) kuvien sisällä ja verrata kahden kuvan tekstin sisältöä erottavaksi.

edellytykset

Sinun tulee tarvita:

  • Visual Studio 2019 tai uudempi
  • .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET alkaen NuGet
  • Tärkeimmät C#-taidot
PM> Install-Package Aspose.OCR

Vaiheittainen toteutus

Vaihe 1: Asenna ja asenna Aspose.OCR

Lisää paketti ja vaaditut nimikkeet:

using Aspose.OCR;

Vaihe 2: Valmista kuvan tiedostot

Aseta kuvat, joita haluat etsiä tai verrata.

string img1 = "document1.png";
string img2 = "document2.jpg";

Vaihe 3: Määritä hakemuksen ja vertailuvaihtoehdot

Määritä asetukset tekstihaun (string tai regex) ja vertailun.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

Vaihe 4: Tekstin etsiminen kuvissa

Käytä sitä ImageHasText nopean, joustavan tekstin hakumenettelyn menetelmä (tukea rivit ja regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

Vaihe 5: Vertaa kaksi kuvaa

Käytä CompareImageTexts Valitse tekstin sisällön eroja:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

Vaihe 6: Lisää virheiden käsittely

Ottaa ja käsitellä virheitä tuotannon kestävyydelle:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Vaihe 7: Optimoi joukkohaun tai vertailun

  • Käsittele kuvia asynkillä tai rinnakkaisilla malleilla
  • Ennalta käsiteltävät kuvat (viljely, puhdistus) korkeammalle tarkkuudelle
  • Fine-tune regex kehittyneille skenaarioille
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

Vaihe 8: Täydellinen esimerkki

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Käytä tapauksia ja sovelluksia

Vastaavuus ja PII:n havaitseminen

Etsi luottamuksellisia tietoja tai malleja (kuten tunnisteita, SSN:itä) digitaalisen kuvan arkistoissa.

Lain ja sopimuksen tarkastelu

Vertaa kuvapohjaisia sopimuksia tai asiakirjoja tekstieroista allekirjoittamisen tai muokkaamisen jälkeen.

Digitaalisen omaisuuden hallinta

Mahdollistaa automaattinen merkintä tai etsiminen suurissa kuvan tallenteissa liiketoimintaprosessin automaatioon.

Yhteiset haasteet ja ratkaisut

Haaste 1: Kuvat erilaisilla tekstityypeillä

** Ratkaisu:** Käytä tapauksetta epäherkkää ja regex-testiä; testaa eri fontteja / taustoja.

Haaste 2: Big Batch -katselu

** Ratkaisu:** Käytä rinnakkaisia tai synkronisia työnkulkuja ja esivaihtoehtoja mahdollisuuksien mukaan.

Haaste 3: Monimutkaiset mallit tai muokattu teksti

** Ratkaisu:** Valitse regex ja testaa näytteiden kuvien kautta; tune asetukset melulle tai muokkauksille.

suorituskyvyn huomioon ottaminen

  • Batch-prosessin nopeus suurissa arkistoissa
  • Käytä laadukkaita kuvia parhaan tarkkuuden varmistamiseksi
  • Tune hakukoneita minimoimaan vääriä positiivisia

Parhaat käytännöt

  • Testaa kaikki hakukoneet ja vertailujärjestelmät ensimmäisessä näytteenotossa
  • Turvallisesti käsitellä ja tallentaa arkaluonteisia tietoja tai hakutuloksia
  • Aspose.OCR päivitetään säännöllisesti ominaisuuksien ja tarkkuuden parantamiseksi

Edistyneet skenaariot

Käsikirjoitus: Advanced Regex for Redaction

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

Käsikirja 2: Monikielinen etsiminen

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

johtopäätöksiä

Aspose.OCR Image Text Finder for .NET antaa sinulle mahdollisuuden etsiä, havaita ja verrata kuvanpohjaista tekstiä tehokkaasti – arkistojen, laillisten ja noudattamisen työnkulkujen kautta.

Löydä lisää esimerkkejä ASPOSE.OCR .NET API-referenssille .

 Suomi