วิธีการค้นหาคําหลักหรือรูปแบบหลายในภาพ

วิธีการค้นหาคําหลักหรือรูปแบบหลายในภาพ

ค้นหาคําหลักหลายหรือรูปแบบข้อความในไฟล์ภาพขนาดใหญ่เป็นสิ่งสําคัญสําหรับการปฏิบัติตามความปลอดภัยและการค้นพบดิจิตอล Aspose.OCR Image Text Finder for .NET ช่วยให้ง่ายต่อการสแกนภาพสําหรับรายการคําสําคัญหรือตัวอย่าง regex

ปัญหาโลกจริง

การตรวจสอบภาพด้วยตนเองสําหรับหลายคํา (เช่นชื่อ IDs, คําอธิบายความลับ) นั้นช้าและไม่น่าเชื่อถือโดยเฉพาะอย่างยิ่งทั่วหลายพันไฟล์

ความคิดเห็นเกี่ยวกับโซลูชัน

การตรวจจับอัตโนมัติโดยการเรียกใช้คําหลักหลายหรือการค้นหา regex บนชุดของภาพ การรายงานหรือกระทําเกี่ยวกับการแข่งขันเพื่อการปฏิบัติตาม HR หรือกรณีที่ใช้ทางกฎหมายดิจิตอล

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR

using Aspose.OCR;

ขั้นตอนที่ 2: กําหนดคําหลักหรือรูปแบบของคุณ

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

ขั้นตอนที่ 3: บัตรภาพค้นหาสําหรับคําหลัก / รูปแบบ

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

ขั้นตอน 4: เข้าสู่ระบบและดําเนินการเกี่ยวกับการแข่งขัน

  • การบันทึกผลใน CSV, ส่งแจ้งเตือนหรือเปิดตัวการทํางานบน Match
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

ขั้นตอน 5: การจัดการข้อผิดพลาดและประสิทธิภาพ

  • ใช้ try/catch สําหรับงานชุดที่แข็งแกร่ง
  • คู่มือสําหรับชุดขนาดใหญ่ถ้าจําเป็น
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

ขั้นตอน 6: ตัวอย่างที่สมบูรณ์

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

การตรวจสอบการปฏิบัติตาม

ตรวจสอบไฟล์ที่สแกนโดยอัตโนมัติสําหรับคําในรายการสีดําหรือรูปแบบที่ละเอียดอ่อน

HR, กฎหมายและรักษาความปลอดภัย

ตรวจสอบความปรากฏตัวของคําอธิบายที่เชื่อถือได้ชื่อพนักงานหรือ PII ในไฟล์การจดหมายหรือหลักฐาน

การวิเคราะห์แนวโน้มและความถี่

การคํานวณและรายงานความถี่ของคําหลักในช่วงเวลาในชุดเอกสารขนาดใหญ่

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: ข้อดีที่ไม่ซ้ํากัน

โซลูชัน: ลบคําหลักและ regex; ตรวจสอบกรณีขอบด้วยตนเอง

ความท้าทาย 2: ขนาดแบทช์ขนาดใหญ่

โซลูชัน: ใช้การประมวลผลแบบคู่และจัดการข้อผิดพลาดที่แข็งแกร่ง

ความท้าทาย 3: หลายภาษา

**โซลูชัน:**ปรับการตั้งค่าการรับรู้และรายการคําหลักตามชุดภาษา

การพิจารณาประสิทธิภาพ

  • งานแบทช์อาจใช้เวลานานสําหรับไฟล์ขนาดใหญ่ - โปรแกรมประมวลผลจอแสดงผลไดรฟ์และบันทึก
  • คู่มือถ้าจําเป็นสําหรับการส่งผ่านสูง
  • เข้าสู่ระบบผลทั้งหมดสําหรับการตรวจสอบและการปฏิบัติตาม

แนวทางที่ดีที่สุด

  • ปรับปรุงและปรับปรุงรายการคําหลักอย่างต่อเนื่อง
  • การบันทึกและรายงานข้อผิดพลาดอัตโนมัติ
  • การทดสอบตัวอย่างอักษรการเป็นตัวแทน
  • บันทึกที่ปลอดภัยและผลการค้นหา

การ์ตูนขั้นสูง

ฉาก 1: ค้นหาและเน้นผลลัพธ์ในไฟล์ PDF

การส่งออกรูปภาพที่มีคําหลักที่ระบุไว้ (หลังการประมวลผลที่กําหนดเอง)

สภาพแวดล้อม 2: บันทึกการตรวจสอบคําหลักแบบถาวร

งานอัตโนมัติที่จะทํางานคืนหรือสัปดาห์เพื่อให้ปฏิบัติตาม

ข้อสรุป

Aspose.OCR Image Text Finder for .NET ช่วยให้การค้นหาคําหลักและรูปแบบแบบอัตโนมัติที่มีประสิทธิภาพซึ่งสนับสนุนการปฏิบัติตามความปลอดภัยและการวิเคราะห์แนวโน้มในไฟล์ภาพ

See Aspose.OCR สําหรับการอ้างอิง API .NET สําหรับตัวอย่างการค้นหาข้อความขั้นสูง

 แบบไทย