如何在搜索结果中突出发现的关键词或模式
如何在搜索结果中突出发现的关键词或模式
视觉反馈 - 突出发现的术语或模式 - 在遵守、发现和文档审查应用程序中显著提高了可用性和评论速度. Aspose.OCR Image Text Finder for .NET 支持 OCR 搜索结果的编程引导。
现实世界问题
浏览搜索结果的大组用户需要视觉测试,以便在图像中快速找到相匹配的术语/模式。
解决方案概述
检测比赛,使用 OCR 区域数据获取边界框坐标,并为终端用户编程上传高点/备忘录。
原則
- Visual Studio 2019 或以后
- .NET 6.0 或更高
- Aspose.OCR 为 .NET 从 NuGet
- System.Drawing.Common 或 SkiaSharp for overlay
PM> Install-Package Aspose.OCR
PM> Install-Package System.Drawing.Common
步骤实施
步骤1:运行 OCR 并找到关键词/模式的区域
using Aspose.OCR;
using System.Drawing;
string imgFile = "document.png";
string keyword = "Confidential";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(new OcrInput(InputType.SingleImage) { imgFile }, settings);
foreach (var block in results[0].TextBlocks)
{
if (block.Text.Contains(keyword))
{
// Proceed to highlight this region (block.Rect)
}
}
步骤2:在图像上加重突出点
using (Bitmap bmp = new Bitmap(imgFile))
using (Graphics g = Graphics.FromImage(bmp))
{
foreach (var block in results[0].TextBlocks)
{
if (block.Text.Contains(keyword))
{
var rect = block.Rect; // Rectangle coordinates from OCR
g.DrawRectangle(new Pen(Color.Red, 3), rect.X, rect.Y, rect.Width, rect.Height);
}
}
bmp.Save($"highlighted_{Path.GetFileName(imgFile)}");
}
步骤3:多场/超级比赛
- 视觉处理与折扣颜色,透明度,或标记。
步骤4:完整的例子
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
class Program
{
static void Main(string[] args)
{
string imgFile = "document.png";
string keyword = "Confidential";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(new OcrInput(InputType.SingleImage) { imgFile }, settings);
using (Bitmap bmp = new Bitmap(imgFile))
using (Graphics g = Graphics.FromImage(bmp))
{
foreach (var block in results[0].TextBlocks)
{
if (block.Text.Contains(keyword))
{
var rect = block.Rect;
g.DrawRectangle(new Pen(Color.Red, 3), rect.X, rect.Y, rect.Width, rect.Height);
}
}
bmp.Save($"highlighted_{Path.GetFileName(imgFile)}");
}
}
}
使用案例和应用程序
法律和遵守评论
突出在快速批准的扫描合同中发现的条款。
数字资产管理
视觉记录图像,以便更容易收回和审查。
电子探测与审计
标记并提供遵守、审计或争议的证据。
共同挑战与解决方案
挑战1:过度包装/复杂模式
** 解決方案:** 使用不同的亮點風格/顏色,以獲得清晰度。
挑战2:OCR区域准确性
** 解决方案:** 验证坐标和调节 OCR / 图像分辨率。
挑战3:Batch/Automated Highlights
** 解决方案:** 为大型套件优化 rendering 和平行 overlay。
绩效考虑
- Overlay rendering 是快速的,但可以按尺寸打瓶 - 使用 async 在可能的地方
- 集成过程和记录突出文件
最佳实践
- 在发布到终端用户之前视觉验证突出点
- 保证所有图像和突出漏洞的隐私
- 定期测试各种文件类型和模式
- 提供 toggle/undo 为互动UI
先进的场景
场景1:自定义广告/文本标签
显示关键字文本、重度或自定义笔记。
场景2:出口到PDF或多格式输出
以 PDF 或图像集为共享/审查。
结论
Aspose.OCR Image Text Finder for .NET 使您能够轻松地在图像中编程地突出并列出所发现的术语,从而提高符合性、发现和业务工作流的准确性和审查速度。
See ASPOSE.OCR 为 .NET API 参考 更先进的搜索和标记功能。