كيفية إعداد الصور المسجلة لـ OCR مع Deskew باستخدام .NET
يبدأ OCR الدقيق (التعرف على الشخصية البصرية) بالصور المنحنية تمامًا.تقلل المفاتيح أو التدوير من دقة OCC ، وبالتالي فإن الانحناء هو خطوة حاسمة في إجراء المعالجة المسبقة.يسمح لك Aspose.Imaging for .NET بتقليص المستندات / الصور للحصول على أفضل النتائج في أي أداة OCD الخارجية.
مشكلة العالم الحقيقي
يعمل محركات OCR بشكل أفضل على الصور المنحنية بشكل جيد.تسبب الفحصات المكسورة في اختفاء الأحرف أو الأخطاء النصية.التشويش اليدوي بطيئ للغاية للقطع الكبيرة.
نظرة عامة على الحل
استخدم Aspose.Imaging لـ .NET لتفريغ الصور التي تم فحصها تلقائيًا. حفظها في تنسيق خالي من الخسائر مثل PNG أو TIFF ، جاهز للاستيراد إلى برامج OCR الخاصة بك (Asposa.OCR ، Tesseract ، إلخ).
المتطلبات
- Visual Studio 2019 أو أحدث
- .NET 6.0 أو أعلى (أو .Net Framework 4.6.2+)
- Aspose.Imaging لـ .NET من NuGet
- وثيقة مسح أو صورة (JPEG، PNG، TIFF، إلخ)
PM> Install-Package Aspose.Imaging
تنفيذ خطوة بخطوة
الخطوة 1: قم بتفريغ الصورة المسجلة
using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;
string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";
using (var image = (RasterImage)Image.Load(inputPath))
{
// Deskew and use white background for optimal OCR results
image.NormalizeAngle(false, Color.White);
image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}
الخطوة 2: نقل الصور المكسورة إلى أي محرك OCR
- استخدم أداة OCR المفضلة الخاصة بك للتعرف على النص من الصورة المكسورة.
- مثال : الاستيراد
scan_for_ocr_deskewed.png
إلى خط أنابيب OCR الخاص بك أو البرمجيات (Aspose.OCR، Tesseract، ABBYY، إلخ).
الخطوة الثالثة: مراجعة وتجديد
- تحقق من نتائج OCR.إذا كانت الدقة منخفضة، قم بتعديل إعدادات الخلفية أو جودة الفحص.
- فكر في معالجة المجموعة لجميع الفحوصات الجديدة للحفاظ على تدفق عمل الرقمنة الخاص بك كفاءة.
استخدام الحالات والتطبيقات
- الرقمنة الأرشيفات والمستندات والعقود أو النماذج للنص القابل للبحث
- إعداد الوثائق التجارية للامتثال والتدقيق
- تعزيز الدقة في أي خط أنابيب أوتوماتيك أو OCR
التحديات والحلول المشتركة
الصور المكسورة لا تزال تسبب أخطاء OCR: حاول ألوان خلفية مختلفة أو تصفية مسبقة للضوضاء أو فحوصات دقة أعلى.
** ملفات الخروج كبيرة جدا:** استخدم TIFF مع الضغط، أو PNG إذا كان هناك حاجة إلى الشفافية.
مزيج من تنسيقات الصورة: قم بتطبيع جميع الفحوصات إلى شكل خالي من الخسائر قبل OCR.
أفضل الممارسات
- استخدم دائمًا تنسيقات الصورة الخالية من الخسائر لـ OCR
- الحفاظ على الصور الأصلية والمعالجة للإشارة
- توثيق سير العمل الخاص بك ودرجة الرقمنة للفريق
FAQ
** س: هل يمكنني إزالة جميع الصور في مجلد واحد؟**الجواب: نعم، قم بتحريك هذا الرمز في شريط على جميع الملفات، كما هو موضح في أمثلة المجموعة السابقة.
**Q: أي لون خلفية يعمل بشكل أفضل لـ OCR؟**الجواب: الأبيض هو الأكثر أمانا للنص؛ استخدم شفاف للرسومات، أو يطابق المستند الخاص بك.
** س: هل من الجيد ضغط الملفات بعد التفريغ؟**A: استخدم الضغط الخالي من الخسائر لتجنب العناصر التي تقلل من دقة OCR.
استنتاجات
التفكير مع Aspose.Imaging for .NET هو ضرورة لـ OCR الموثوقة والرقمية والأتمتة التجارية. الحفاظ على خط أنابيبك نظيفة وسريعة ودقيقة! أرشيف الوسم : .NET API Reference .