Bagaimana untuk mencari dan membandingkan teks dalam imej dengan Aspose.OCR

Bagaimana untuk mencari dan membandingkan teks dalam imej dengan Aspose.OCR

Mencari atau membandingkan teks dalam imej adalah penting untuk pematuhan, arkib digital, dan klasifikasi automatik. Aspose.OCR Image Text Finder untuk .NET membolehkan anda mengidentifikasi, carian dan perbandingan teks gambar dengan ketepatan - melalui pelbagai kes penggunaan dari pengesanan PII kepada penilaian undang-undang.

Masalah dunia sebenar

Perniagaan sering perlu mencari kandungan sensitif, mengesahkan tandatangan, atau membandingkan teks antara versi fail imej yang berbeza. pemeriksaan manual adalah perlahan dan tidak boleh dipercayai, terutamanya untuk arkib digital yang besar atau set dokumen.

Gambaran keseluruhan penyelesaian

Dengan Aspose.OCR, anda boleh mencari teks atau corak tertentu (menggunakan tali atau regex) di dalam imej, dan membandingkan kandungan teks dua gambar untuk menonjolkan perbezaan.

Prerequisites

Anda akan memerlukan :

  • Visual Studio 2019 atau seterusnya
  • .NET 6.0 atau lebih baru (atau .Net Framework 4.6.2+)
  • Aspose.OCR untuk .NET daripada NuGet
  • Kemahiran asas C#
PM> Install-Package Aspose.OCR

Pelaksanaan langkah demi langkah

Langkah 1: Pemasangan dan Konfigurasi Aspose.OCR

Tambahkan pakej dan ruang nama yang diperlukan:

using Aspose.OCR;

Langkah 2: Siapkan fail imej anda

Setkan imej yang anda ingin cari atau bandingkan.

string img1 = "document1.png";
string img2 = "document2.jpg";

Langkah 3: Mengesetkan opsyen carian dan perbandingan

Mengesetkan tetapan untuk carian teks (string atau regex) dan perbandingan.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

Langkah 4: Cari teks dalam imej

Gunakan yang ImageHasText kaedah untuk carian teks yang cepat dan fleksibel (support string dan regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

Langkah 5: Bandingkan teks dua imej

Use CompareImageTexts Perbezaan dalam kandungan teks:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

Langkah 6: Menambah penyelesaian kesilapan

Menangkap dan menangani kesilapan untuk kestabilan pengeluaran:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Langkah 7: Mengoptimumkan untuk Pencarian Bulk atau Perbandingan

  • Pemprosesan imej dalam batch menggunakan corak async atau paralel
  • imej pra-proses (menanam, membersihkan) untuk ketepatan yang lebih tinggi
  • Fine-tune regex untuk senario lanjutan
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

Langkah 8 : Contoh Lengkap

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Penggunaan Kasus dan Permohonan

Kepatuhan dan pengesanan PII

Mencari data atau corak rahsia (seperti ID, SSN) dalam arkib imej digital.

Penilaian Undang-undang dan Kontrak

Bandingkan kontrak berdasarkan imej atau dokumen untuk perbezaan teks selepas menandatangani atau mengedit.

Pengurusan Aset Digital

Membolehkan tag automatik atau carian dalam repositori imej yang besar untuk automasi proses perniagaan.

Tantangan dan Penyelesaian Bersama

Tantangan 1: Gambar dengan gaya teks yang berbeza

** Penyelesaian:** Gunakan kes-tidak sensitif dan regex matching; ujian pada pelbagai fon / latar belakang.

Tantangan 2 : Pencarian Batch Besar

** Penyelesaian:** Gunakan aliran kerja paralel atau asinkron, dan imej pra-proses di mana mungkin.

Tantangan 3: corak kompleks atau teks yang disusun

** Penyelesaian:** Refine regex dan menguji gambar sampel; tetapan tune untuk bunyi bising atau imej yang disusun.

Pertimbangan prestasi

  • Proses batch untuk kelajuan pada arkib besar
  • Gunakan imej sumber berkualiti tinggi untuk ketepatan terbaik
  • Tuna corak carian untuk meminimumkan positif palsu

amalan terbaik

  • Ujian semua corak carian dan perbandingan pada set sampel terlebih dahulu
  • Mengendalikan dan log maklumat sensitif atau hasil carian dengan selamat
  • Mengemas kini Aspose.OCR secara berkala untuk ciri-ciri dan peningkatan ketepatan

Senario lanjutan

Senario 1: Regex Lanjutan untuk Redaksi

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

Scenario 2: Pencarian pelbagai bahasa

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

Conclusion

Aspose.OCR Image Text Finder untuk .NET membolehkan anda untuk mencari, mengesan, dan membandingkan teks berasaskan imej dengan cekap—melalui arsip, undang-undang dan aliran kerja pematuhan.

Cari lebih banyak contoh dalam Aspose.OCR untuk .NET API Rujukan .

 Melayu