چگونه متن را در تصاویر با Aspose.OCR جستجو و مقایسه کنیم
جستجو یا مقایسه متن در داخل تصاویر برای انطباق، آرشیو های دیجیتال و طبقه بندی اتوماتیک ضروری است. Aspose.OCR Image Text Finder برای .NET به شما اجازه می دهد تا متن تصویر را با دقت شناسایی، جستجو و مقایسه کنید – از طریق طیف وسیعی از موارد استفاده از تشخیص PII تا بررسی قانونی.
مشکل دنیای واقعی
کسب و کارها اغلب نیاز به جستجو برای محتوای حساس، تأیید امضا، و یا مقایسه متن بین نسخه های مختلف از فایل های تصویر.
بررسی راه حل
با Aspose.OCR، شما می توانید برای متن یا الگوهای خاص (با استفاده از نوارها یا regex) در تصاویر جستجو کنید و محتوای متن دو تصویر را با تفاوت ها مقایسه کنید.
پیش شرط
شما نیاز خواهید داشت:
- Visual Studio 2019 یا بالاتر
- .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
- Aspose.OCR برای .NET از NuGet
- مهارت های C#
PM> Install-Package Aspose.OCR
پیاده سازی گام به گام
مرحله 1: نصب و تنظیم Aspose.OCR
اضافه کردن بسته و فضای نام مورد نیاز:
using Aspose.OCR;
مرحله دوم: فایل های تصویر خود را آماده کنید
تصاویر را که می خواهید جستجو کنید یا مقایسه کنید تنظیم کنید.
string img1 = "document1.png";
string img2 = "document2.jpg";
مرحله 3: گزینه های جستجو و مقایسه را تنظیم کنید
تنظیمات برای جستجوی متن (string یا regex) و مقایسه.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed
مرحله 4: جستجو برای متن در یک تصویر
استفاده از ImageHasText
روش جستجوی متن سریع و انعطاف پذیر (شبکه های پشتیبانی و regex):
AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");
// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");
مرحله 5: مقایسه متن دو تصویر
استفاده CompareImageTexts
تفاوت در محتوای متن:
int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");
مرحله ششم: اضافه کردن خطا
ضبط و مقابله با اشتباهات برای استقامت تولید:
try
{
AsposeOcr ocr = new AsposeOcr();
bool found = ocr.ImageHasText(img1, "PII", settings);
int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
مرحله 7: بهینه سازی برای جستجوی عمده یا مقایسه
- پردازش تصاویر در بسته ها با استفاده از الگوهای آسینک یا موازی
- تصاویر پیش پردازش (زراعت، تمیز کردن) برای دقت بالاتر
- Fine-tune regex برای سناریوهای پیشرفته
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
bool found = ocr.ImageHasText(file, "Confidential", settings);
if (found) { Console.WriteLine($"Found in: {file}"); }
}
مرحله هشتم: نمونه کامل
using Aspose.OCR;
using System;
class Program
{
static void Main(string[] args)
{
try
{
string img1 = "contract1.png";
string img2 = "contract2.png";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
// Search for specific text
bool isFound = ocr.ImageHasText(img1, "NDA", settings);
Console.WriteLine($"Text found: {isFound}");
// Compare two images
int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
Console.WriteLine($"Image text similarity: {similarity}%");
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
استفاده از موارد و برنامه ها
انطباق و تشخیص PII
جستجو برای داده های محرمانه یا الگوهای (مانند شناسه ها، SSN ها) در داخل فایل های تصویر دیجیتال.
بررسی قانونی و قراردادی
مقایسه قراردادهای یا اسناد مبتنی بر تصویر برای اختلافات متن پس از امضای یا ویرایش.
مدیریت دارایی های دیجیتال
امکان برچسب گذاری اتوماتیک یا جستجو در ذخایر تصویر بزرگ برای اتوماسیون فرآیندهای کسب و کار.
چالش ها و راه حل های مشترک
چالش اول: تصاویر با سبک های متن متن متغیر
** راه حل:** استفاده از مطابقت ناخوشایند و regex؛ تست بر روی فونت های مختلف / پس زمینه ها.
چالش دوم: جستجوی بزرگ
** راه حل:** از جریان های کار موازی یا غیر همزمان و تصاویر پیش پردازش در صورت امکان استفاده کنید.
چالش 3: الگوهای پیچیده یا متن ویرایش شده
**مطالعه:**تصویر را رگکس کنید و تصاویر نمونه را آزمایش کنید؛ تنظیمات تن برای صدا یا تصاویر ویرایش شده.
بررسی عملکرد
- فرآیند پیچ برای سرعت در آرشیو های بزرگ
- استفاده از تصاویر منبع با کیفیت بالا برای بهترین دقت
- الگوهای جستجو برای به حداقل رساندن مثبت های جعلی
بهترین شیوهها
- آزمایش تمام الگوهای جستجو و مقایسه در مجموعه نمونه اول
- مدیریت ایمن و ثبت اطلاعات حساس یا نتایج جستجو
- به طور منظم به روز رسانی Aspose.OCR برای ویژگی ها و بهبود دقت
سناریوهای پیشرفته
فصل اول: Regex برای ویرایش
bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);
فصل دوم: جستجوی چند زبانه
settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);
نتیجه گیری
Aspose.OCR Image Text Finder برای .NET به شما اجازه می دهد تا متن مبتنی بر تصویر را به طور موثر جستجو، تشخیص و مقایسه کنید – از طریق آرشیوها، قوانین و جریان های کار انطباق.
بیشتر نمونه ها را در Aspose.OCR برای .NET API مرجع .