วิธีการสร้าง PII อัตโนมัติหรือท่อแก้ไขคําหลักด้วย .NET

วิธีการสร้าง PII อัตโนมัติหรือท่อแก้ไขคําหลักด้วย .NET

การแก้ไขข้อมูลที่สามารถระบุตัวตนได้ (PII) และคําหลักที่ละเอียดอ่อนในภาพสแกนเป็นสิ่งสําคัญสําหรับความเป็นส่วนตัวกฎหมายและการปฏิบัติตามขั้นตอน การค้นหาข้อความภาพ ASPOSE.OCR สําหรับ .NET ช่วยให้สามารถอัตโนมัติการตรวจจับและการเขียนในกระบวนการทํางานของชุด

ปัญหาโลกจริง

การเขียนข้อมูลที่เชื่อถือได้ในเอกสารที่สแกนเป็นแบบคู่มือช้าข้อผิดพลาดและมีค่าใช้จ่าย การอัตโนมัติเป็นสิ่งจําเป็นเพื่อให้แน่ใจว่าการซับซ้อนที่น่าเชื่อมั่นและสม่ําเสมอสําหรับการตรวจสอบการปฏิบัติตามและความเป็นส่วนตัว

ความคิดเห็นเกี่ยวกับโซลูชัน

การตรวจจับ PII หรือคําหลักโดยอัตโนมัติโดยใช้ OCR จากนั้น mask, blur หรือแทนที่พวกเขาในภาพและบันทึกผลการแก้ไขเพื่อให้แน่ใจว่าความเป็นส่วนตัวและความปลอดภัย

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
  • PII หรือรายการคําหลักในไฟล์ข้อความ
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: การเตรียมรายการ PII / Keyword และภาพเข้า

List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");

ขั้นตอน 2: ค้นหา PII / Keywords

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string pii in piiList)
    {
        bool found = ocr.ImageHasText(file, pii, settings);
        if (found)
        {
            // Proceed to redact in Step 3
        }
    }
}

ขั้นตอนที่ 3: แก้ไขหรือนวดข้อกําหนดที่พบ

  • ในขณะที่ Aspose.OCR ระบุข้อกําหนดการแก้ไขจะต้องใช้กับห้องสมุดภาพ (เช่น System.Drawing, SkiaSharp)
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
    using (var g = Graphics.FromImage(image))
    {
        // Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
        // g.FillRectangle(Brushes.Black, x, y, width, height);
    }
    image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}

ขั้นตอน 4: เข้าสู่ระบบไฟล์ที่แก้ไข

File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");

ขั้นตอน 5: เคล็ดลับการทํางานแบบบูรณาการ

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;

class Program
{
    static void Main(string[] args)
    {
        List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
        string[] files = Directory.GetFiles("./input", "*.png");
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        foreach (string file in files)
        {
            foreach (string pii in piiList)
            {
                bool found = ocr.ImageHasText(file, pii, settings);
                if (found)
                {
                    // Redact by overlay (simplified; see docs for bounding box)
                    using (var image = new Bitmap(file))
                    using (var g = Graphics.FromImage(image))
                    {
                        // Example: Draw rectangle where text is found (requires OCR region info)
                        // g.FillRectangle(Brushes.Black, x, y, width, height);
                        // Save redacted copy
                        image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
                    }
                    File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
                }
            }
        }
    }
}

หมายเหตุ: สําหรับการวางแผนภูมิที่แม่นยําใช้ APIs การรับรู้ภูมิภาคของ Aspose.OCR เพื่อรับโค้ดของบล็อกข้อความที่ถูกตรวจพบแล้วซ่อนอย่างถูกต้อง

ใช้กรณีและแอปพลิเคชัน

กฎหมายและการปฏิบัติตาม

การเขียนสัญญาอัตโนมัติไฟล์ HR และเอกสารที่ควบคุม

การตรวจสอบความเป็นส่วนตัว

ตรวจสอบให้แน่ใจว่า PII ไม่ตกอยู่ในไฟล์สแกน, บอร์ดหรือไฟล์หลักฐาน

การป้องกันการสูญเสียข้อมูล (Data Loss Prevention)

หยุดการแบ่งปันหรือจัดเก็บข้อมูลที่ละเอียดอ่อนในภาพสแกน

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: ค้นหาพื้นที่ข้อความที่แม่นยํา

โซลูชัน: ใช้ OCR ตารางข้อความและแผนที่สําหรับการซ่อนภาพ

ความท้าทาย 2: ความล้มเหลว / ความเสียหาย

โซลูชัน: ลําดับรายการคําหลักการยืนยันภาพที่แก้ไขและทําการตรวจสอบ

ความท้าทาย 3: ขนาดงานแบทช์

โซลูชัน: คู่มือการจัดการข้อผิดพลาดและอัตโนมัติสําหรับขนาด

การพิจารณาประสิทธิภาพ

  • การคํานวณภูมิภาคและการเขียนภาพอาจช้าสําหรับชุดขนาดใหญ่ — ใช้ async ถ้าจําเป็น
  • เข้าสู่ระบบข้อความทั้งหมดสําหรับการตรวจสอบการปฏิบัติตาม

แนวทางที่ดีที่สุด

  • การทดสอบภูมิภาคแผนที่ความแม่นยําด้วยภาพที่แตกต่างกัน
  • ปรับปรุงรายการคําหลักอย่างต่อเนื่องสําหรับรูปแบบ PII ใหม่
  • การรักษาความปลอดภัยทั้งไฟล์เดิมและแก้ไข
  • การยืนยันด้วยการตรวจสอบ Spot-Manual

การ์ตูนขั้นสูง

ฉาก 1: Blur แทน Blackout

ใช้ตัวกรองภาพเพื่อดูดซึมพื้นที่ที่ได้รับการตรวจพบเพื่อการซับซ้อนมากขึ้น

สภาพแวดล้อม 2: การแก้ไขที่กําหนดเอง / การเปลี่ยนข้อความ

เคลือบแท็กที่กําหนดเอง (เช่น “REDACTED”) แทนกล่องสีดํา

ข้อสรุป

Aspose.OCR Image Text Finder for .NET ช่วยให้คุณสามารถอัตโนมัติการเขียน PII / Keyword ที่สแกน - ลดความเสี่ยงทางกฎหมายและรับประกันความเป็นส่วนตัวทั่วไฟล์ภาพ

สําหรับ APIs ภูมิภาคที่แม่นยําและการรวมการเขียนดู Aspose.OCR สําหรับการอ้างอิง API .NET .

 แบบไทย