วิธีการค้นหาคําหลักหรือรูปแบบหลายในภาพ
ค้นหาคําหลักหลายหรือรูปแบบข้อความในไฟล์ภาพขนาดใหญ่เป็นสิ่งสําคัญสําหรับการปฏิบัติตามความปลอดภัยและการค้นพบดิจิตอล Aspose.OCR Image Text Finder for .NET ช่วยให้ง่ายต่อการสแกนภาพสําหรับรายการคําสําคัญหรือตัวอย่าง regex
ปัญหาโลกจริง
การตรวจสอบภาพด้วยตนเองสําหรับหลายคํา (เช่นชื่อ IDs, คําอธิบายความลับ) นั้นช้าและไม่น่าเชื่อถือโดยเฉพาะอย่างยิ่งทั่วหลายพันไฟล์
ความคิดเห็นเกี่ยวกับโซลูชัน
การตรวจจับอัตโนมัติโดยการเรียกใช้คําหลักหลายหรือการค้นหา regex บนชุดของภาพ การรายงานหรือกระทําเกี่ยวกับการแข่งขันเพื่อการปฏิบัติตาม HR หรือกรณีที่ใช้ทางกฎหมายดิจิตอล
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR
using Aspose.OCR;
ขั้นตอนที่ 2: กําหนดคําหลักหรือรูปแบบของคุณ
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport
ขั้นตอนที่ 3: บัตรภาพค้นหาสําหรับคําหลัก / รูปแบบ
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
}
}
ขั้นตอน 4: เข้าสู่ระบบและดําเนินการเกี่ยวกับการแข่งขัน
- การบันทึกผลใน CSV, ส่งแจ้งเตือนหรือเปิดตัวการทํางานบน Match
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");
ขั้นตอน 5: การจัดการข้อผิดพลาดและประสิทธิภาพ
- ใช้ try/catch สําหรับงานชุดที่แข็งแกร่ง
- คู่มือสําหรับชุดขนาดใหญ่ถ้าจําเป็น
try
{
// Searching logic
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
ขั้นตอน 6: ตัวอย่างที่สมบูรณ์
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
try
{
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
}
}
ใช้กรณีและแอปพลิเคชัน
การตรวจสอบการปฏิบัติตาม
ตรวจสอบไฟล์ที่สแกนโดยอัตโนมัติสําหรับคําในรายการสีดําหรือรูปแบบที่ละเอียดอ่อน
HR, กฎหมายและรักษาความปลอดภัย
ตรวจสอบความปรากฏตัวของคําอธิบายที่เชื่อถือได้ชื่อพนักงานหรือ PII ในไฟล์การจดหมายหรือหลักฐาน
การวิเคราะห์แนวโน้มและความถี่
การคํานวณและรายงานความถี่ของคําหลักในช่วงเวลาในชุดเอกสารขนาดใหญ่
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: ข้อดีที่ไม่ซ้ํากัน
โซลูชัน: ลบคําหลักและ regex; ตรวจสอบกรณีขอบด้วยตนเอง
ความท้าทาย 2: ขนาดแบทช์ขนาดใหญ่
โซลูชัน: ใช้การประมวลผลแบบคู่และจัดการข้อผิดพลาดที่แข็งแกร่ง
ความท้าทาย 3: หลายภาษา
**โซลูชัน:**ปรับการตั้งค่าการรับรู้และรายการคําหลักตามชุดภาษา
การพิจารณาประสิทธิภาพ
- งานแบทช์อาจใช้เวลานานสําหรับไฟล์ขนาดใหญ่ - โปรแกรมประมวลผลจอแสดงผลไดรฟ์และบันทึก
- คู่มือถ้าจําเป็นสําหรับการส่งผ่านสูง
- เข้าสู่ระบบผลทั้งหมดสําหรับการตรวจสอบและการปฏิบัติตาม
แนวทางที่ดีที่สุด
- ปรับปรุงและปรับปรุงรายการคําหลักอย่างต่อเนื่อง
- การบันทึกและรายงานข้อผิดพลาดอัตโนมัติ
- การทดสอบตัวอย่างอักษรการเป็นตัวแทน
- บันทึกที่ปลอดภัยและผลการค้นหา
การ์ตูนขั้นสูง
ฉาก 1: ค้นหาและเน้นผลลัพธ์ในไฟล์ PDF
การส่งออกรูปภาพที่มีคําหลักที่ระบุไว้ (หลังการประมวลผลที่กําหนดเอง)
สภาพแวดล้อม 2: บันทึกการตรวจสอบคําหลักแบบถาวร
งานอัตโนมัติที่จะทํางานคืนหรือสัปดาห์เพื่อให้ปฏิบัติตาม
ข้อสรุป
Aspose.OCR Image Text Finder for .NET ช่วยให้การค้นหาคําหลักและรูปแบบแบบอัตโนมัติที่มีประสิทธิภาพซึ่งสนับสนุนการปฏิบัติตามความปลอดภัยและการวิเคราะห์แนวโน้มในไฟล์ภาพ
See Aspose.OCR สําหรับการอ้างอิง API .NET สําหรับตัวอย่างการค้นหาข้อความขั้นสูง