画像で敏感なキーワードや視聴リストの用語を検出および報告する方法
画像で敏感なキーワードや視聴リストの用語を検出および報告する方法
ビジネスや組織は、セキュリティ、人事、または規制の義務を満たすために、ブラックリストまたは敏感な用語の存在のためにデジタルイメージアーカイブを定期的にスキャンする必要があります。
現実世界問題
禁止または敏感なフレーズの画像アーカイブの手動検査は、エラーによる、時間の消費、および無限です。
ソリューション概要
Aspose.OCR Image Text Finder を使用すると、組織の視聴リストに含まれる条件のためのスキャンされた画像の全ファイルまたはフォルダーをスキャンし、自動的にフラッグしてレビューのヒットを記録することができます。
原則
- Visual Studio 2019 以降
- .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET から NuGet
- テキストファイルにおける敏感なキーワード/視聴リスト(1行ごとに1つの用語)
PM> Install-Package Aspose.OCR
ステップ・ステップ・実施
ステップ1:敏感なキーワード/ウォッチリストファイルの準備
List<string> watchlist = new List<string>(File.ReadAllLines("watchlist.txt"));
ステップ2:バッチスキャンのための画像アーカイブを設定する
string[] imageFiles = Directory.GetFiles("./archive", "*.png", SearchOption.AllDirectories);
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
ステップ3: Watchlist の条件のための画像をスキャンする
foreach (string image in imageFiles)
{
foreach (string keyword in watchlist)
{
bool found = ocr.ImageHasText(image, keyword, settings);
if (found)
{
File.AppendAllText("watchlist_hits.csv", $"{image},{keyword},found\n");
}
}
}
ステップ4:キーワードヒットにログ、レポート、または警告
- CSVに結果を追加し、自動メールを送信するか、システムにフラッグを入力して人間のレビューを行います。
ステップ5:レビュー、監査、最適化
- 定期的にヒットログをチェックし、ポリシーが変更されるにつれてキーワード/ウォッチリストを表示します。
- あなたのアーカイブのスピードと正確さのためにバッチの仕事をテストします。
ステップ6:完璧な例
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
List<string> watchlist = new List<string>(File.ReadAllLines("watchlist.txt"));
string[] imageFiles = Directory.GetFiles("./archive", "*.png", SearchOption.AllDirectories);
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string image in imageFiles)
{
foreach (string keyword in watchlist)
{
bool found = ocr.ImageHasText(image, keyword, settings);
if (found)
File.AppendAllText("watchlist_hits.csv", $"{image},{keyword},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("audit_errors.log", ex.Message + Environment.NewLine);
}
}
}
ケースとアプリケーションの使用
セキュリティと規制遵守
ビジネス、法的、または政府のアーカイブで禁止されたフレーズや機密識別を検索する。
HRと職場政策の実施
デジタル文書やスキャンされた記録に不適切かつ政策違反の用語を示す。
デジタル法学と調査
証拠アーカイブでターゲット名、アカウント、または用語を検索します。
共通の課題と解決策
課題1:大規模なアーカイブとバッチの仕事
**ソリューション:**夜間走り、分割作業、または必要に応じてパラレル化します。
課題2:政策や監視リストの変更
ソリューション: watchlist.txt を現在の条件で更新し、各監査後にログをレビューします。
チャレンジ3:失われた、あるいは偽りのポジティブ
ソリューション: OCR/画像の品質と視聴リストを調整し、手動で表示された結果をレビューします。
パフォーマンス考慮
- 大規模なアーカイブの処理は、リソースインテンツ(モニターディスクとメモリ)になることができます。
- ビジネス中断を避けるために時間外の仕事のバッチまたはスケジュール
- プライバシーと遵守のためのセキュアログファイル
ベストプラクティス
- あなたの視聴リストを更新し、法的/遵守によってレビューされます。
- すべてのヒットと監査トラックを安全に記録する
- 定期的なスキャンとレビューの自動化
- 最高の正確さのために高品質の入力画像を使用する
高度なシナリオ
シナリオ1:電子メールまたはスラックへの自動警告
キーワードのヒットに従事職員へのトリガー通知。
シナリオ2:DMSまたはケースマネジメントと統合
ドキュメント管理または調査システム内の自動タグおよびフラッグファイル。
結論
ASPOSE.OCR Image Text Finder for .NET は、敏感、ブラックリスト、またはポリシーキーワードの画像アーカイブをスキャンするための強力なツールであり、スケール可能で、繰り返し、審査可能な遵守作業流を可能にします。
より先進的なスキャンオプションを見つける ASPOSE.OCR for .NET API リファレンス .