วิธีการอัตโนมัติการประมวลผลและการวางแผนงาน OCR โดยใช้ Aspose.OCR

วิธีการอัตโนมัติการประมวลผลและการวางแผนงาน OCR โดยใช้ Aspose.OCR

กระแสการทํางานของเอกสารจํานวนมากต้องการการประมวลผล OCR ที่น่าเชื่อถือและไม่คาดหวัง Aspose.OCR สําหรับ .NET สนับสนุนการอัตโนมัติชุดเต็มรูปแบบ - แผงตรวจสอบงานที่วางแผนการจัดการปริมาณขนาดใหญ่และการกู้คืนจากข้อผิดพลาดเพื่อให้มีประสิทธิภาพสูงสุด

ปัญหาโลกจริง

ธุรกิจต้องประมวลผลหลายพันไฟล์สแกนทุกคืนหรือสัปดาห์ OCR มือถือหรือแบบโต้ตอบไม่สกรูและเพิ่มความเสี่ยงของข้อผิดพลาด การอัตโนมัติและการวางแผนให้แน่ใจว่างานจะทํางานได้อย่างน่าเชื่อถือแม้กระทั่งในเวลานานหรือในเวลาว่าง

ความคิดเห็นเกี่ยวกับโซลูชัน

การรวมกัน Aspose.OCR แพคเกจ API, การตรวจสอบไฟล์ / ไฟล์, และเครื่องมือการวางแผน (Task Scheduler, cron, ฯลฯ) เพื่ออัตโนมัติ OCR ที่สแกน Monitor for new files, process in batches, and export results to desired formats and archives.

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
  • (ตัวเลือก) Windows Task Scheduler, cron หรือเครื่องมืออัตโนมัติงานอื่น ๆ
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR

using Aspose.OCR;

ขั้นตอนที่ 2: ค้นหาไฟล์สําหรับการประมวลผลแบทช์

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

ขั้นตอนที่ 3: Run OCR in Batches

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

ขั้นตอน 4: การส่งออกและผลลัพธ์ของ Archive

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

ขั้นตอน 5: บันทึกงานและข้อผิดพลาด

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

ขั้นตอน 6: การวางแผนอัตโนมัติ (Windows Task Scheduler ตัวอย่าง)

  • สร้างไฟล์ชุดหรือสคริปต์ PowerShell เพื่อดําเนินการงาน OCR ของคุณตามแผนที่
  • ใช้ Task Scheduler สําหรับการทํางานทุกวันคืนหรือบน trigger
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

ขั้นตอน 7: Advanced – การตรวจสอบโฟลเดอร์สําหรับไฟล์ใหม่

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

ขั้นตอน 8: ตัวอย่างที่สมบูรณ์

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

ห้องอีเมลขององค์กรและกล่องดิจิตอล

การประมวลผลแบบอัตโนมัติของเอกสารที่มาโดยไม่มีความพยายามด้วยตนเอง

การดูแลสุขภาพกฎหมายและกระแสการทํางานของ Archiving

บันทึกงาน OCR คืนหรือสัปดาห์สําหรับบันทึกทางการแพทย์สัญญาหรือเอกสาร

การดําเนินงานทางการเงินและการปฏิบัติตาม

งานรายงานอัตโนมัติและการปฏิบัติตามที่ประมวลผลการสแกนขนาดใหญ่ในระยะเวลากลางวัน

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: การเริ่มต้นคู่มือที่ไม่น่าเชื่อถือ

โซลูชัน: ใช้เครื่องมือการวางแผนสําหรับงานที่ไม่คาดหวังเสมอ

ความท้าทาย 2: ความผิดพลาดในชุดขนาดใหญ่

โซลูชัน: การบันทึกอัตโนมัติและการจัดการข้อผิดพลาดเพื่อการทํางานที่แข็งแกร่ง

ความท้าทาย 3: Job Overlap หรือทรัพยากร จํากัด

**โซลูชัน: ** Stagger งานการตรวจสอบทรัพยากรและการแจ้งเตือนเกี่ยวกับความช้าหรือความล้มเหลว

การพิจารณาประสิทธิภาพ

  • การตรวจสอบ CPU, ความจําและไดรฟ์ในระหว่างงานขนาดใหญ่
  • ใช้บันทึกการผลิตและข้อผิดพลาดสําหรับการวิเคราะห์หลังการทํางาน
  • งานแบทช์ควรได้รับการวางแผนกลางวันเพื่อหลีกเลี่ยงผลกระทบ

แนวทางที่ดีที่สุด

  • งานทดสอบกับประเภทไฟล์และปริมาณที่แตกต่างกัน
  • ตรวจสอบบันทึกสําหรับความล้มเหลวหรือประสิทธิภาพช้า
  • การรักษาความปลอดภัยและจัดเก็บทั้งไฟล์แหล่งและส่งออก
  • ปรับปรุงและบํารุงรักษาสคริปต์อัตโนมัติ

การ์ตูนขั้นสูง

สภาพแวดล้อม 1: คู่มือหรือกระจายงานแบทช์

ส่วนแบ่งงานผ่านเซิร์ฟเวอร์หลายหรือ VM สําหรับขนาด

ฉาก 2: การแจ้งเตือนในเวลาจริงเกี่ยวกับการเสร็จสิ้นงาน

ส่งอีเมลหรือแจ้งเตือน Webhook หลังจากเสร็จสิ้นงานที่วางแผน

ข้อสรุป

Aspose.OCR for .NET ช่วยให้การอัตโนมัติงาน OCR ที่แข็งแกร่งและไม่มีความคาดหวัง ด้วยการประมวลผลชุดและการวางแผนคุณสามารถรับประกันการไหลการทํางานในเวลาที่เชื่อถือได้และทนต่อข้อผิดพลาด Aspose.OCR สําหรับการอ้างอิง API .NET สําหรับบิตอัตโนมัติเคล็ดลับและรหัส

 แบบไทย