วิธีการสร้าง PII อัตโนมัติหรือท่อแก้ไขคําหลักด้วย .NET
การแก้ไขข้อมูลที่สามารถระบุตัวตนได้ (PII) และคําหลักที่ละเอียดอ่อนในภาพสแกนเป็นสิ่งสําคัญสําหรับความเป็นส่วนตัวกฎหมายและการปฏิบัติตามขั้นตอน การค้นหาข้อความภาพ ASPOSE.OCR สําหรับ .NET ช่วยให้สามารถอัตโนมัติการตรวจจับและการเขียนในกระบวนการทํางานของชุด
ปัญหาโลกจริง
การเขียนข้อมูลที่เชื่อถือได้ในเอกสารที่สแกนเป็นแบบคู่มือช้าข้อผิดพลาดและมีค่าใช้จ่าย การอัตโนมัติเป็นสิ่งจําเป็นเพื่อให้แน่ใจว่าการซับซ้อนที่น่าเชื่อมั่นและสม่ําเสมอสําหรับการตรวจสอบการปฏิบัติตามและความเป็นส่วนตัว
ความคิดเห็นเกี่ยวกับโซลูชัน
การตรวจจับ PII หรือคําหลักโดยอัตโนมัติโดยใช้ OCR จากนั้น mask, blur หรือแทนที่พวกเขาในภาพและบันทึกผลการแก้ไขเพื่อให้แน่ใจว่าความเป็นส่วนตัวและความปลอดภัย
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
- PII หรือรายการคําหลักในไฟล์ข้อความ
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอน 1: การเตรียมรายการ PII / Keyword และภาพเข้า
List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");
ขั้นตอน 2: ค้นหา PII / Keywords
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string pii in piiList)
{
bool found = ocr.ImageHasText(file, pii, settings);
if (found)
{
// Proceed to redact in Step 3
}
}
}
ขั้นตอนที่ 3: แก้ไขหรือนวดข้อกําหนดที่พบ
- ในขณะที่ Aspose.OCR ระบุข้อกําหนดการแก้ไขจะต้องใช้กับห้องสมุดภาพ (เช่น System.Drawing, SkiaSharp)
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
using (var g = Graphics.FromImage(image))
{
// Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
// g.FillRectangle(Brushes.Black, x, y, width, height);
}
image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}
ขั้นตอน 4: เข้าสู่ระบบไฟล์ที่แก้ไข
File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
ขั้นตอน 5: เคล็ดลับการทํางานแบบบูรณาการ
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;
class Program
{
static void Main(string[] args)
{
List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string pii in piiList)
{
bool found = ocr.ImageHasText(file, pii, settings);
if (found)
{
// Redact by overlay (simplified; see docs for bounding box)
using (var image = new Bitmap(file))
using (var g = Graphics.FromImage(image))
{
// Example: Draw rectangle where text is found (requires OCR region info)
// g.FillRectangle(Brushes.Black, x, y, width, height);
// Save redacted copy
image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}
File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
}
}
}
}
}
หมายเหตุ: สําหรับการวางแผนภูมิที่แม่นยําใช้ APIs การรับรู้ภูมิภาคของ Aspose.OCR เพื่อรับโค้ดของบล็อกข้อความที่ถูกตรวจพบแล้วซ่อนอย่างถูกต้อง
ใช้กรณีและแอปพลิเคชัน
กฎหมายและการปฏิบัติตาม
การเขียนสัญญาอัตโนมัติไฟล์ HR และเอกสารที่ควบคุม
การตรวจสอบความเป็นส่วนตัว
ตรวจสอบให้แน่ใจว่า PII ไม่ตกอยู่ในไฟล์สแกน, บอร์ดหรือไฟล์หลักฐาน
การป้องกันการสูญเสียข้อมูล (Data Loss Prevention)
หยุดการแบ่งปันหรือจัดเก็บข้อมูลที่ละเอียดอ่อนในภาพสแกน
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: ค้นหาพื้นที่ข้อความที่แม่นยํา
โซลูชัน: ใช้ OCR ตารางข้อความและแผนที่สําหรับการซ่อนภาพ
ความท้าทาย 2: ความล้มเหลว / ความเสียหาย
โซลูชัน: ลําดับรายการคําหลักการยืนยันภาพที่แก้ไขและทําการตรวจสอบ
ความท้าทาย 3: ขนาดงานแบทช์
โซลูชัน: คู่มือการจัดการข้อผิดพลาดและอัตโนมัติสําหรับขนาด
การพิจารณาประสิทธิภาพ
- การคํานวณภูมิภาคและการเขียนภาพอาจช้าสําหรับชุดขนาดใหญ่ — ใช้ async ถ้าจําเป็น
- เข้าสู่ระบบข้อความทั้งหมดสําหรับการตรวจสอบการปฏิบัติตาม
แนวทางที่ดีที่สุด
- การทดสอบภูมิภาคแผนที่ความแม่นยําด้วยภาพที่แตกต่างกัน
- ปรับปรุงรายการคําหลักอย่างต่อเนื่องสําหรับรูปแบบ PII ใหม่
- การรักษาความปลอดภัยทั้งไฟล์เดิมและแก้ไข
- การยืนยันด้วยการตรวจสอบ Spot-Manual
การ์ตูนขั้นสูง
ฉาก 1: Blur แทน Blackout
ใช้ตัวกรองภาพเพื่อดูดซึมพื้นที่ที่ได้รับการตรวจพบเพื่อการซับซ้อนมากขึ้น
สภาพแวดล้อม 2: การแก้ไขที่กําหนดเอง / การเปลี่ยนข้อความ
เคลือบแท็กที่กําหนดเอง (เช่น “REDACTED”) แทนกล่องสีดํา
ข้อสรุป
Aspose.OCR Image Text Finder for .NET ช่วยให้คุณสามารถอัตโนมัติการเขียน PII / Keyword ที่สแกน - ลดความเสี่ยงทางกฎหมายและรับประกันความเป็นส่วนตัวทั่วไฟล์ภาพ
สําหรับ APIs ภูมิภาคที่แม่นยําและการรวมการเขียนดู Aspose.OCR สําหรับการอ้างอิง API .NET .