Како претражити и упоредити текст у сликама са Aspose.OCR
Претраживање или упоређивање текста унутар слика је од суштинског значаја за усклађеност, дигиталне архиве и аутоматску класификацију.Аппосе.ОЦР Изображење текста за .НЕТ вам омогућава да идентификујете, претражите и упоредите текст слике са тачношћу – кроз низ случајева коришћења од откривања ПИИ до правног прегледа.
Реал светски проблем
Пословање често треба да тражи осетљив садржај, провери потписи, или упореди текст између различитих верзија сличних датотека. ручни прегледи су спори и непоуздани, посебно за велике дигиталне архиве или сете докумената.
Преглед решења
Са Aspose.OCR, можете претражити одређени текст или обрасци (користећи траке или регекс) у сликама, и упоредити текстуални садржај две слике да бисте пронашли разлике.
Принципи
Ви ћете требати:
- Visual Studio 2019 или касније
- .NET 6.0 или новији (или .Net Framework 4.6.2+)
- Aspose.OCR za .NET od NuGet
- Основне вештине Ц #
PM> Install-Package Aspose.OCR
Корак по корак спровођење
Корак 1: Инсталирајте и конфигуришете Aspose.OCR
Додајте пакету и потребне имена простора:
using Aspose.OCR;
Корак 2: Припремите своје слике датотеке
Поставите слике које желите да претражите или упоредите.
string img1 = "document1.png";
string img2 = "document2.jpg";
Корак 3: Конфигурисање опција за претрагу и поређење
Konfigurirajte postavke za pretragu teksta (string ili regex) i usporedbu.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed
Корак 4: Претраживање текста у слици
Искористите је ImageHasText
метода за брзо, флексибилно претраживање текста (подржава траке и регекс):
AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");
// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");
Корак 5: Поређење текста две слике
Коришћење CompareImageTexts
Да бисте приметили разлике у текстуалном садржају:
int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");
Корак 6: Додајте третман грешака
Ухватити и управљати грешкама за производњу издржљивости:
try
{
AsposeOcr ocr = new AsposeOcr();
bool found = ocr.ImageHasText(img1, "PII", settings);
int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Корак 7: Оптимизација за масовну претрагу или поређење
- Обрада слика у батовима користећи асинц или паралелне обрасци
- Препроцес слике (расти, очистити) за већу прецизност
- Fine-tune regex za napredne scenarije
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
bool found = ocr.ImageHasText(file, "Confidential", settings);
if (found) { Console.WriteLine($"Found in: {file}"); }
}
Корак 8: Потпуни пример
using Aspose.OCR;
using System;
class Program
{
static void Main(string[] args)
{
try
{
string img1 = "contract1.png";
string img2 = "contract2.png";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
// Search for specific text
bool isFound = ocr.ImageHasText(img1, "NDA", settings);
Console.WriteLine($"Text found: {isFound}");
// Compare two images
int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
Console.WriteLine($"Image text similarity: {similarity}%");
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Коришћење случајева и апликација
Усклађеност и ПИИ откривање
Претраживање поверених података или обрасца (као што су ИД, ССН) унутар дигиталних архива слике.
Правни и уговорни преглед
Поређење уговора или докумената на основу слике за текстуалне разлике након потписивања или уређивања.
Управљање дигиталним средствима
Омогућава аутоматско означивање или претрагу у великим сликама за аутоматизацију пословног процеса.
Заједнички изазови и решења
Проблем 1: Слике са различитим текстовим стиловима
Решење: Користите случајне и регекс одговарајуће; тестирајте на различитим шрифтовима / позадини.
Проблем 2: Велики бацх претраге
Решење: Користите паралелне или асинхронне радне токове и препроцес слике где је могуће.
Проблем 3: Комплексни обрасци или Редактирани текст
Решење: Рефинирајте регекс и тестирајте кроз узорке слике; тонирање подешавања за буке или уређених слика.
Размишљање о перформанси
- Батцх процес за брзину на великим архивима
- Користите висококвалитетне изворне слике за најбољу тачност
- Tune tražilice za minimizovanje lažnih pozitivnih
Најбоља пракса
- Тестирајте све претраге и поређење обрасца на узорцима прво
- Безбедно управљати и регистровати осетљиве информације или резултате претраге
- Редовно ажурирајте Aspose.OCR за побољшање карактеристика и тачности
Напредни сценарио
Сценарио 1: Напредни Регекс за Редакцију
bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);
Сценарио 2: Мулти-језичне претраге
settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);
Закључак
Aspose.OCR Image Text Finder for .NET вам омогућава да ефикасно претражите, откријете и упоређујете текст заснован на слици – кроз архиве, правне и пословне токове.
Пронађите више примера у Aspose.OCR за .NET API референце .