Hogyan lehet keresni és összehasonlítani a szöveget a képekben az Aspose.OCR-vel

Hogyan lehet keresni és összehasonlítani a szöveget a képekben az Aspose.OCR-vel

A képekben lévő szöveg keresése vagy összehasonlítása elengedhetetlen a megfeleléshez, a digitális archívumokhoz és az automatizált osztályozáshoz.A Aspose.OCR Image Text Finder for .NET lehetővé teszi a kép szövegének azonosítását, keresését és pontosságát – a PII-felismeréstől a jogi felülvizsgálatig terjedő felhasználási esetek széles körében.

Valódi problémák

A vállalkozásoknak gyakran kell keresniük az érzékeny tartalmat, ellenőrizni a aláírásokat, vagy összehasonlítani a szöveget a képfájlok különböző verziói között.A kézi ellenőrzések lassúak és megbízhatatlanok, különösen a nagy digitális archívumok vagy dokumentumkészletek esetében.

megoldás áttekintése

Az Aspose.OCR segítségével konkrét szövegeket vagy mintákat kereshet (szalagokat vagy regexeket használva) a képekben, és összehasonlíthatja a két kép szöveges tartalmát a különbségekre.

előfeltételek

Szükséged lesz:

  • Visual Studio 2019 vagy újabb
  • .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET a NuGet-ről
  • Alapvető C# készségek
PM> Install-Package Aspose.OCR

lépésről lépésre megvalósítás

1. lépés: Az Aspose.OCR telepítése és konfigurálása

Adja meg a csomagot és a szükséges névterületeket:

using Aspose.OCR;

2. lépés: Készítsd el a képfájlokat

Állítsa be azokat a képeket, amelyeket keresni vagy összehasonlítani szeretne.

string img1 = "document1.png";
string img2 = "document2.jpg";

3. lépés: Keresési és összehasonlító opciók beállítása

Állítsa be a beállításokat a szövegkereséshez (string vagy regex) és az összehasonlításhoz.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

4. lépés: A szöveg keresése egy képben

Használja a ImageHasText gyors, rugalmas szövegkeresési módszer (támogatja a szálakat és a regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

5. lépés: Összehasonlítsa a két kép szövegét

Használat CompareImageTexts Különbségek a szöveges tartalmakban:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

6. lépés: Hibaelhárítás hozzáadása

Gyűjtés és kezelési hibák a termelési rugalmasság:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. lépés: Optimalizálja a tömeges keresést vagy összehasonlítást

  • Képek feldolgozása async vagy párhuzamos minták használatával
  • Preprocess képek (termelés, tisztítás) a magasabb pontosság
  • Fine-tune regex a fejlett forgatókönyvekhez
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

8. lépés: Teljes példa

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Esetek és alkalmazások használata

Megfelelés és PII felderítés

Keresse meg a bizalmas adatokat vagy mintákat (például azonosítókat, SSN-eket) a digitális kép archívumokban.

Jogi és szerződéses felülvizsgálat

Összehasonlítsa a képalapú szerződéseket vagy dokumentumokat a szövegkülönbségekhez az aláírás vagy a szerkesztés után.

Digitális eszközkezelés

Lehetővé teszi az automatizált címkézést vagy a keresést nagy képtárakban az üzleti folyamatok automációjához.

Közös kihívások és megoldások

1. kihívás: A változatos szövegstílusú képek

** Megoldás:** Használjon esettelen és regex megfelelést; teszteljen különböző betűtípusokon / háttérben.

2. kihívás: Nagy csomópont keresés

** Megoldás:** Használja a párhuzamos vagy aszinkron munkafolyamatokat, valamint a preprocess képeket, ahol lehetséges.

3. kihívás: összetett minták vagy szerkesztett szöveg

** Megoldás:** A regex és a próbaverziós képek felülvizsgálata; hangszóró beállítások zajos vagy szerkesztett képekre.

A teljesítmény megfontolása

  • Batch-folyamat a nagy archívumok sebességére
  • Használjon kiváló minőségű forrásképeket a legjobb pontosság érdekében
  • Keresse meg a keresési mintákat, hogy minimalizálja a hamis pozitív

Legjobb gyakorlatok

  • Próbáld ki az összes keresési és összehasonlító mintát a mintázatokon először
  • Biztonságosan kezeli és rögzíti az érzékeny információkat vagy a keresési eredményeket
  • Rendszeresen frissíti az ASPOSE.OCR-t a funkciók és a pontosság javítása érdekében

fejlett forgatókönyvek

1. forgatókönyv: Advanced Regex for Redaction

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

2. forgatókönyv: Többnyelvű keresés

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

következtetések

Az ASPOSE.OCR Image Text Finder for .NET lehetővé teszi, hogy hatékonyan keresse, észleli és összehasonlítsa a képalapú szöveget – archívumok, jogi és megfelelőségi munkafolyamatok révén.

További példákat talál a Az ASPOSE.OCR a .NET API referenciájához .

 Magyar