Πώς να αναζητήσετε και να συγκρίνετε το κείμενο σε εικόνες με Aspose.OCR

Πώς να αναζητήσετε και να συγκρίνετε το κείμενο σε εικόνες με Aspose.OCR

Η αναζήτηση ή η σύγκριση του κειμένου μέσα στις εικόνες είναι απαραίτητη για τη συμμόρφωση, τα ψηφιακά αρχεία και την αυτοματοποιημένη ταξινόμηση. το Aspose.OCR Image Text Finder για .NET σας επιτρέπει να εντοπίσετε, να αναζητήσετε και να συγκρίνετε το κείμενο της εικόνας με ακρίβεια – μέσα σε μια σειρά από περιπτώσεις χρήσης από την ανίχνευση PII μέχρι την νομική επανεξέταση.

Το πρόβλημα του πραγματικού κόσμου

Οι επιχειρήσεις συχνά χρειάζονται να αναζητήσουν ευαίσθητο περιεχόμενο, να επαληθεύσουν τις υπογραφές ή να συγκρίνουν το κείμενο μεταξύ διαφορετικών εκδόσεων αρχείων εικόνας. Οι χειροκίνητοι έλεγχοι είναι αργοί και απίστευτοι, ειδικά για μεγάλα ψηφιακά αρχεία ή σύνολα εγγράφων.

Συνοπτική λύση

Με το Aspose.OCR, μπορείτε να αναζητήσετε συγκεκριμένο κείμενο ή πρότυπα (χρησιμοποιώντας γραμμές ή regex) μέσα στις εικόνες, και να συγκρίνετε το κειμενικό περιεχόμενο των δύο εικόνων για να εντοπίσετε τις διαφορές.

Προϋποθέσεις

Θα χρειαστείτε:

  • Visual Studio 2019 ή αργότερα
  • .NET 6.0 ή μεταγενέστερος (ή .Net Framework 4.6.2+)
  • Aspose.OCR για .NET από το NuGet
  • Βασικές δεξιότητες C#
PM> Install-Package Aspose.OCR

Βήμα προς βήμα εφαρμογή

Βήμα 1: Εγκατάσταση και διαμόρφωση Aspose.OCR

Προσθέστε το πακέτο και απαιτούνται ονομαστικοί χώροι:

using Aspose.OCR;

Βήμα 2: Προετοιμάστε τα αρχεία εικόνας σας

Καθορίστε τις εικόνες που θέλετε να αναζητήσετε ή να συγκρίνετε.

string img1 = "document1.png";
string img2 = "document2.jpg";

Βήμα 3: Ρυθμίστε επιλογές αναζήτησης και σύγκρισης

Καθορίστε τις ρυθμίσεις για την αναζήτηση κειμένου (string ή regex) και τη σύγκριση.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

Βήμα 4: Αναζήτηση κειμένου σε μια εικόνα

Χρησιμοποιήστε το ImageHasText μέθοδος γρήγορης, ευέλικτης αναζήτησης κειμένου (υποστηρίζονται γραμμές και regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

Βήμα 5: Συγκρίνετε το κείμενο των δύο εικόνων

Χρήση CompareImageTexts Για να εντοπίσετε τις διαφορές στο κείμενο:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

Βήμα 6: Προσθήκη επεξεργασίας σφαλμάτων

Πατήστε και χειριστείτε τα λάθη για την παραγωγική αντοχή:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Βήμα 7: Βελτιστοποίηση για μαζική αναζήτηση ή σύγκριση

  • Επεξεργασία εικόνων σε μπαταρίες χρησιμοποιώντας async ή παράλληλα πρότυπα
  • Προεπεξεργασία εικόνων (καλλιέργεια, καθαρισμός) για μεγαλύτερη ακρίβεια
  • Fine-tune regex για προηγμένα σενάρια
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

Βήμα 8: Συμπληρωματικό παράδειγμα

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Χρήση περιπτώσεων και εφαρμογών

Συμμόρφωση και ανίχνευση PII

Αναζήτηση για εμπιστευτικά δεδομένα ή πρότυπα (όπως IDs, SSNs) μέσα στα αρχεία ψηφιακής εικόνας.

Νομική και Σύμβαση Αναθεώρηση

Συγκρίνετε συμβάσεις ή έγγραφα με βάση την εικόνα για διαφορές κειμένου μετά την υπογραφή ή την επεξεργασία.

Διαχείριση ψηφιακών περιουσιακών στοιχείων

Επιτρέπει την αυτόματη ετικέτα ή την αναζήτηση σε μεγάλα αποθήκες εικόνας για την αυτοματοποίηση των επιχειρηματικών διαδικασιών.

Κοινές προκλήσεις και λύσεις

Δοκιμή 1: Φωτογραφίες με διαφορετικά στυλ κειμένου

Λύση: Χρησιμοποιήστε περιπτωσιο-μη ευαίσθητη και regex ταιριάζουν. δοκιμή σε διάφορες γραμματοσειρές / υπόβαθρες.

Challenge 2: Big Batch αναζητήσεις

Λύση: Χρησιμοποιήστε παράλληλες ή ασύγχρονες ροές εργασίας και εικόνες προεπεξεργασίας όπου είναι δυνατόν.

Πρόκληση 3: Σύνθετα πρότυπα ή επεξεργασμένο κείμενο

Λύση: Αναθεωρήστε το regex και δοκιμάστε τις εικόνες δείγματος. ρυθμίσεις τόνου για θορύβους ή επεξεργασμένες εικόνας.

Αξιολόγηση των επιδόσεων

  • Διαδικασία Batch για ταχύτητα σε μεγάλα αρχεία
  • Χρησιμοποιήστε υψηλής ποιότητας εικόνες πηγής για την καλύτερη ακρίβεια
  • Μειώστε τα πρότυπα αναζήτησης για να ελαχιστοποιήσετε τα ψεύτικα θετικά

שיטות עבודה מומלצות

  • Δοκιμάστε όλα τα πρότυπα αναζήτησης και σύγκρισης σε δείγματα πρώτα
  • Ασφαλή επεξεργασία και καταγραφή ευαίσθητων πληροφοριών ή αποτελεσμάτων αναζήτησης
  • Τακτικά ενημερώνετε το Aspose.OCR για βελτιώσεις χαρακτηριστικών και ακρίβειας

Προχωρημένα σενάρια

Σενάριο 1: Προηγμένο Regex για την Redaction

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

Σενάριο 2: Πολυγλωσσική αναζήτηση

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

Συμπεράσματα

Το Aspose.OCR Image Text Finder για το .NET σας επιτρέπει να αναζητάτε, να εντοπίζετε και να συγκρίνετε αποτελεσματικά το κείμενο με βάση την εικόνα – μέσω των αρχείων, των νομικών και των ροών εργασίας συμμόρφωσης.

Βρείτε περισσότερα παραδείγματα στο Aspose.OCR για την αναφορά .NET API .

 Ελληνικά