วิธีการค้นหาและเปรียบเทียบข้อความในภาพด้วย Aspose.OCR

วิธีการค้นหาและเปรียบเทียบข้อความในภาพด้วย Aspose.OCR

การค้นหาหรือเปรียบเทียบข้อความภายในภาพเป็นสิ่งสําคัญสําหรับการปฏิบัติตามเอกสารดิจิตอลและการจัดอันดับอัตโนมัติ Aspose.OCR Image Text Finder for .NET ช่วยให้คุณสามารถระบุการค้นหาและประมวลผลข้อความภาพได้อย่างแม่นยํา - ทั่วช่วงของกรณีการใช้งานตั้งแต่การตรวจจับ PII ถึงการตรวจสอบทางกฎหมาย

ปัญหาโลกจริง

ธุรกิจมักต้องค้นหาเนื้อหาที่อ่อนแอการยืนยันการลงชื่อหรือเปรียบเทียบข้อความระหว่างเวอร์ชันที่แตกต่างกันของไฟล์ภาพ การตรวจสอบด้วยตนเองช้าและไม่น่าเชื่อถือโดยเฉพาะอย่างยิ่งสําหรับไฟล์ดิจิตอลขนาดใหญ่หรือชุดเอกสาร

ความคิดเห็นเกี่ยวกับโซลูชัน

ด้วย Aspose.OCR คุณสามารถค้นหาข้อความหรือรูปแบบที่เฉพาะเจาะจง (ใช้สายหรือ regex) ในภาพและเปรียบเทียบเนื้อหาข้อความของภาพสองภาพเพื่อให้เห็นความแตกต่าง ดีสําหรับการตรวจสอบสัญญาการปฏิบัติตามหรือการจัดการสินทรัพย์ดิจิตอล

ข้อกําหนด

คุณจะต้อง:

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
  • ความสามารถพื้นฐาน C#
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR

เพิ่มแพคเกจและพื้นที่ชื่อที่ต้องการ:

using Aspose.OCR;

ขั้นตอนที่ 2: การเตรียมไฟล์ภาพของคุณ

สร้างภาพที่คุณต้องการค้นหาหรือเปรียบเทียบ

string img1 = "document1.png";
string img2 = "document2.jpg";

ขั้นตอนที่ 3: การตั้งค่าตัวเลือกการค้นหาและการเปรียบเทียบ

การตั้งค่าสําหรับการค้นหาข้อความ (string หรือ regex) และเปรียบเทียบ

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

ขั้นตอน 4: ค้นหาข้อความในภาพ

ใช้ ImageHasText วิธีการค้นหาข้อความที่รวดเร็วและยืดหยุ่น (สนับสนุนสายและ regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

ขั้นตอน 5: การเปรียบเทียบข้อความของภาพสอง

ใช้ CompareImageTexts เพื่อสังเกตความแตกต่างในเนื้อหาข้อความ:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

ขั้นตอน 6: เพิ่มการจัดการข้อผิดพลาด

การจับและจัดการข้อผิดพลาดเพื่อความแข็งแรงในการผลิต:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

ขั้นตอน 7: การเพิ่มประสิทธิภาพสําหรับการค้นหาหรือการเปรียบเทียบจํานวนมาก

  • การประมวลผลภาพในชุดโดยใช้รูปแบบ async หรือคู่มือ
  • ภาพก่อนการประมวลผล (เพาะปลูกทําความสะอาด) สําหรับความแม่นยําสูง
  • Fine-tune regex สําหรับสถานการณ์ขั้นสูง
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

ขั้นตอน 8: ตัวอย่างที่สมบูรณ์

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

การสอดคล้องและการตรวจจับ PII

ค้นหาข้อมูลหรือรูปแบบที่เชื่อถือได้ (เช่น IDs, SSNs) ในไฟล์ภาพดิจิตอล

การตรวจสอบกฎหมายและสัญญา

การเปรียบเทียบสัญญาหรือเอกสารตามภาพสําหรับความแตกต่างทางข้อความหลังจากการลงนามหรือแก้ไข

การจัดการสินทรัพย์ดิจิตอล

อนุญาตให้ทําเครื่องหมายอัตโนมัติหรือค้นหาในสต็อกภาพขนาดใหญ่เพื่อการปรับปรุงกระบวนการทางธุรกิจ

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: ภาพที่มีรูปแบบข้อความที่แตกต่างกัน

โซลูชัน: ใช้การจับคู่ที่ไม่มีความไวต่อกรณีและ regex การทดสอบบน fonts / backgrounds ที่แตกต่างกัน

ความท้าทาย 2: การค้นหาแบทช์ขนาดใหญ่

โซลูชัน: ใช้กระแสการทํางานแบบสม่ําเสมอหรือไม่ซิงโครนและรูปภาพก่อนการประมวลผลเมื่อเป็นไปได้

ความท้าทาย 3: รูปแบบที่ซับซ้อนหรือข้อความที่แก้ไข

โซลูชัน: ลบและทดสอบภาพผ่านตัวอย่าง การตั้งค่าเสียงสําหรับเสียงหรือภาพที่แก้ไข

การพิจารณาประสิทธิภาพ

  • กระบวนการแบทช์สําหรับความเร็วในไฟล์ขนาดใหญ่
  • ใช้ภาพแหล่งที่มาที่มีคุณภาพสูงเพื่อความแม่นยําที่ดีที่สุด
  • Tune โมเดอร์การค้นหาเพื่อลดความล้มเหลวเชิงลบ

แนวทางที่ดีที่สุด

  • ตรวจสอบรูปแบบการค้นหาและเปรียบเทียบทั้งหมดในชุดตัวอย่างครั้งแรก
  • การจัดการและบันทึกข้อมูลที่ละเอียดอ่อนหรือผลการค้นหาอย่างปลอดภัย
  • ปรับปรุง Aspose.OCR โดยปกติเพื่อปรับปรุงคุณสมบัติและความแม่นยํา

การ์ตูนขั้นสูง

สภาพแวดล้อม 1: Advanced Regex for Redaction

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

ฉาก 2: ค้นหาหลายภาษา

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

ข้อสรุป

Aspose.OCR Image Text Finder for .NET ช่วยให้คุณสามารถค้นหาการตรวจจับและเปรียบเทียบข้อความตามภาพได้อย่างมีประสิทธิภาพผ่านกระบวนการทํางานของเอกสารกฎหมายและการปฏิบัติตาม การนําอัตโนมัติไปยังงานการตรวจสอบด้วยมือด้วยการค้นหาข้อความที่แข็งแกร่งและถูกต้อง

ค้นหาตัวอย่างเพิ่มเติมใน Aspose.OCR สําหรับการอ้างอิง API .NET .

 แบบไทย