كيفية مقارنة النص عبر إصدارات المستندات باستخدام .NET
مقارنة النص بين الإصدارات المختلفة من العقود أو النماذج أو الوثائق التجارية أمر حاسم بالنسبة للمراجعة القانونية والامتثال.Aspose.OCR Image Text Finder for .NET يسرع العملية عن طريق استخراج وتقارن النص تلقائيًا من العديد من الصور.
مشكلة العالم الحقيقي
مراجعة اليدوية لتغيرات النسخة بطيئة، عرضة للخطأ البشري، وغير قابلة للتوسع – وخاصة عند التعامل مع العديد من مراجعات الوثائق أو العقود القانونية.
نظرة عامة على الحل
تلقائي المقارنة عن طريق استخراج النص من اثنين أو أكثر من الصور المسح، ثم باستخدام المنطق ديف لتسليط الضوء على وتسجيل التغييرات النصية.
المتطلبات
- Visual Studio 2019 أو أحدث
- .NET 6.0 أو أعلى (أو .Net Framework 4.6.2+)
- Aspose.OCR لـ .NET من NuGet
PM> Install-Package Aspose.OCR
تنفيذ خطوة بخطوة
الخطوة 1: إعداد نسخ المستندات
string original = "contract_v1.png";
string revised = "contract_v2.png";
الخطوة 2: التعرف على النص واستخراج النص من الصور
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
string originalText = ocr.Recognize(new OcrInput(InputType.SingleImage) { original }, settings)[0].RecognitionText;
string revisedText = ocr.Recognize(new OcrInput(InputType.SingleImage) { revised }, settings)[0].RecognitionText;
الخطوة 3: مقارنة النص وتسليط الضوء على الاختلافات
استخدم مكتبة النص/المقارنة (على سبيل المثال، DiffPlex، المنطق المدمج) لتحديد الاختلافات:
using DiffPlex;
using DiffPlex.DiffBuilder;
using DiffPlex.DiffBuilder.Model;
var diffBuilder = new InlineDiffBuilder(new Differ());
var diff = diffBuilder.BuildDiffModel(originalText, revisedText);
foreach (var line in diff.Lines)
{
if (line.Type != ChangeType.Unchanged)
Console.WriteLine($"{line.Type}: {line.Text}");
}
الخطوة 4: نتائج مقارنة التسجيل والتصدير
- حفظ التغييرات في CSV أو ملف السجل أو تقرير diff القابل للقراءة للإنسان
// Example: Write all changes to a report
File.AppendAllText("text_diff_report.txt", $"{line.Type}: {line.Text}\n");
الخطوة 5: Batch أو التحكم في الإصدار التلقائي
- مقارنة جميع الإصدارات في مجلد، تلقائيا حسب الحاجة
الخطوة 6: نموذج كامل
using Aspose.OCR;
using DiffPlex;
using DiffPlex.DiffBuilder;
using DiffPlex.DiffBuilder.Model;
using System;
using System.IO;
class Program
{
static void Main(string[] args)
{
string original = "contract_v1.png";
string revised = "contract_v2.png";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
string originalText = ocr.Recognize(new OcrInput(InputType.SingleImage) { original }, settings)[0].RecognitionText;
string revisedText = ocr.Recognize(new OcrInput(InputType.SingleImage) { revised }, settings)[0].RecognitionText;
var diffBuilder = new InlineDiffBuilder(new Differ());
var diff = diffBuilder.BuildDiffModel(originalText, revisedText);
foreach (var line in diff.Lines)
{
if (line.Type != ChangeType.Unchanged)
File.AppendAllText("text_diff_report.txt", $"{line.Type}: {line.Text}\n");
}
}
}
استخدام الحالات والتطبيقات
مراجعة القانون والامتثال
تحديد التغييرات بسرعة في العقود أو السياسات أو الاتفاقيات التي تم فحصها.
مراجعة العمليات التجارية
اكتشاف التحرير غير المصرح به أو غير المعتمد في الأرشيف الرقمي.
إدارة المستندات الأتمتة
الحفاظ على مسار مراجعة كامل لجميع التغييرات عبر إصدارات المستند المسح.
التحديات والحلول المشتركة
التحدي الأول: خطأ صغير في التنسيق أو OCR
الحل: قم بتنظيف الإعدادات، قم بإجراء مراجعة دليل ثانوي على التغييرات الملموسة.
التحدي الثاني: مجموعة كبيرة من الوثائق
** الحل:** تلقائي وتوازن، تسجيل جميع النتائج للحصول على مراجعة فعالة.
التحدي الثالث: الإيجابية الكاذبة / السلبية
الحل: تحديد الخوارزميات ديف، وتأكيد الإنتاج مع عينات العالم الحقيقي.
اعتبارات الأداء
- يمكن أن تكون المنطق الخاطئ بطيئة على المستندات الكبيرة - مراقبة وتحسين
- تخزين جميع تقارير diff بأمان للتوافق
- استخدم إعدادات OCR القوية للحصول على أفضل التعرف
أفضل الممارسات
- استخدم نفس OCR وتصفح الإعدادات في جميع الإصدارات
- تصديق الملفات على الوثائق الحاسمة / عالية المخاطر
- تسجيل الدخول واسترداد جميع التقارير
- تلقائي مقارنة النسخة العادية للمستندات الرئيسية
سيناريوهات متقدمة
السيناريو 1: إظهار الاختلافات في النتيجة البصرية
إنشاء ملفات تعريف PDF / الصور المذكورة التي تسلط الضوء على التغييرات النصية المكتشفة للفريق القانوني.
السيناريو 2: إشعار تلقائي للتغيرات الحاسمة
إرسال تحذير / البريد الإلكتروني إذا تم إضافة / إزالة شروط قانونية مهمة.
استنتاجات
يتيح Aspose.OCR Image Text Finder for .NET مقارنة النسخة المستندة التلقائية والمتوسطة والمراجعة – مما يسمح للفريقين القانونيين والأعمال والامتثال للكشف عن التغييرات الحاسمة في الملفات التي يتم فحصها.
للحصول على مزيد من سير العمل المقارنة، انظر أرشيف الوسم : .NET API Reference .