Как подчеркнуть найденные ключевые слова или шаблоны в результатах поиска
Визуальная обратная связь — подчеркивая найденные термины или шаблоны — значительно улучшает полезность и скорость обзора в приложениях для соответствия, обнаружения и обследования документов. Aspose.OCR Image Text Finder для .NET поддерживает программатическое подчеркнутие результатов поиска OCR.
Реальные мировые проблемы
Пользователи, пересматривающие большие пакеты результатов поиска, нуждаются в визуальных сбоях, чтобы быстро выделить соответствующие термины / шаблоны в изображениях.
Решение обзор
Отслеживайте матчи, получайте их граничные координаты с использованием данных о регионе ОКР и программируйте перегрузки / анотации для конечных пользователей.
Предупреждения
- Visual Studio 2019 или позднее
- .NET 6.0 или более поздний
- ASPOSE.OCR для .NET от NuGet
- System.Drawing.Common или SkiaSharp для перегрузки
PM> Install-Package Aspose.OCR
PM> Install-Package System.Drawing.Common
Step-by-Step реализация
Шаг 1: Используйте OCR и найдите регионы для ключевых слов / шагов
using Aspose.OCR;
using System.Drawing;
string imgFile = "document.png";
string keyword = "Confidential";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(new OcrInput(InputType.SingleImage) { imgFile }, settings);
foreach (var block in results[0].TextBlocks)
{
if (block.Text.Contains(keyword))
{
// Proceed to highlight this region (block.Rect)
}
}
Шаг 2: Преодолеть ярлыки на картинке
using (Bitmap bmp = new Bitmap(imgFile))
using (Graphics g = Graphics.FromImage(bmp))
{
foreach (var block in results[0].TextBlocks)
{
if (block.Text.Contains(keyword))
{
var rect = block.Rect; // Rectangle coordinates from OCR
g.DrawRectangle(new Pen(Color.Red, 3), rect.X, rect.Y, rect.Width, rect.Height);
}
}
bmp.Save($"highlighted_{Path.GetFileName(imgFile)}");
}
Шаг 3: Многократные/перерывные матчи
- Обращайтесь визуально с цветом, прозрачностью или анотациями.
Шаг 4: Полный пример
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
class Program
{
static void Main(string[] args)
{
string imgFile = "document.png";
string keyword = "Confidential";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(new OcrInput(InputType.SingleImage) { imgFile }, settings);
using (Bitmap bmp = new Bitmap(imgFile))
using (Graphics g = Graphics.FromImage(bmp))
{
foreach (var block in results[0].TextBlocks)
{
if (block.Text.Contains(keyword))
{
var rect = block.Rect;
g.DrawRectangle(new Pen(Color.Red, 3), rect.X, rect.Y, rect.Width, rect.Height);
}
}
bmp.Save($"highlighted_{Path.GetFileName(imgFile)}");
}
}
}
Используйте случаи и приложения
Обзор юридических и соблюдения
Подчеркивайте условия, найденные в сканированных контрактах для быстрого одобрения.
Управление цифровыми активами
Визуально записывайте изображения для легкого восстановления и пересмотра.
E-Discovery и Audit
Маркировать и представлять доказательства соответствия, аудита или спора.
Общие вызовы и решения
Проблема 1: Сверхзащитные/комплексные шаблоны
Решение: Используйте различные стили/цветки для яркости.
Проблема 2: ОКР региональная точность
Решение: Валидируйте координаты и тонус резолюции OCR/изображения.
Проблема 3: Автоматическое освещение / Batch
**Решение: ** Оптимизируйте рендерирование и паралелизуйте обложку для больших наборов.
Рассмотрим производительность
- Рендерирование перегрузки быстро, но может бутилировать по шкале — используйте async, где это возможно
- Батч-процесс и запись подчеркиваемых файлов
Лучшие практики
- Валидируйте ярлыки визуально перед публикацией для конечных пользователей
- Защитите все изображения и ярко выраженные поверхности для конфиденциальности
- Регулярные тесты с различными типами файлов и шаблонами
- Оферта toggle/undo для интерактивных УИ
Развитые сценарии
Сценарий 1: Настроенные анотации/текстовые этикетки
Показать текст ключевых слов, тяжесть или персонализированные заметки на поверхностях.
Сценарий 2: Экспорт в PDF или мультиформатный выход
Рендеры подчеркивают на PDF или наборах изображений для обмена/пересмотра.
Заключение
ASPOSE.OCR Image Text Finder для .NET позволяет программатически подчеркивать и записывать найденные термины в изображениях — улучшая точность и скорость пересмотра для соответствия, обнаружения и рабочих потоков бизнеса.
See ASPOSE.OCR для .NET API Для более продвинутых функций поиска и анотации.