วิธีการอัตโนมัติการประมวลผลและการวางแผนงาน OCR โดยใช้ Aspose.OCR
กระแสการทํางานของเอกสารจํานวนมากต้องการการประมวลผล OCR ที่น่าเชื่อถือและไม่คาดหวัง Aspose.OCR สําหรับ .NET สนับสนุนการอัตโนมัติชุดเต็มรูปแบบ - แผงตรวจสอบงานที่วางแผนการจัดการปริมาณขนาดใหญ่และการกู้คืนจากข้อผิดพลาดเพื่อให้มีประสิทธิภาพสูงสุด
ปัญหาโลกจริง
ธุรกิจต้องประมวลผลหลายพันไฟล์สแกนทุกคืนหรือสัปดาห์ OCR มือถือหรือแบบโต้ตอบไม่สกรูและเพิ่มความเสี่ยงของข้อผิดพลาด การอัตโนมัติและการวางแผนให้แน่ใจว่างานจะทํางานได้อย่างน่าเชื่อถือแม้กระทั่งในเวลานานหรือในเวลาว่าง
ความคิดเห็นเกี่ยวกับโซลูชัน
การรวมกัน Aspose.OCR แพคเกจ API, การตรวจสอบไฟล์ / ไฟล์, และเครื่องมือการวางแผน (Task Scheduler, cron, ฯลฯ) เพื่ออัตโนมัติ OCR ที่สแกน Monitor for new files, process in batches, and export results to desired formats and archives.
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
- (ตัวเลือก) Windows Task Scheduler, cron หรือเครื่องมืออัตโนมัติงานอื่น ๆ
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR
using Aspose.OCR;
ขั้นตอนที่ 2: ค้นหาไฟล์สําหรับการประมวลผลแบทช์
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
ขั้นตอนที่ 3: Run OCR in Batches
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
ขั้นตอน 4: การส่งออกและผลลัพธ์ของ Archive
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
ขั้นตอน 5: บันทึกงานและข้อผิดพลาด
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
ขั้นตอน 6: การวางแผนอัตโนมัติ (Windows Task Scheduler ตัวอย่าง)
- สร้างไฟล์ชุดหรือสคริปต์ PowerShell เพื่อดําเนินการงาน OCR ของคุณตามแผนที่
- ใช้ Task Scheduler สําหรับการทํางานทุกวันคืนหรือบน trigger
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
ขั้นตอน 7: Advanced – การตรวจสอบโฟลเดอร์สําหรับไฟล์ใหม่
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
ขั้นตอน 8: ตัวอย่างที่สมบูรณ์
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
ใช้กรณีและแอปพลิเคชัน
ห้องอีเมลขององค์กรและกล่องดิจิตอล
การประมวลผลแบบอัตโนมัติของเอกสารที่มาโดยไม่มีความพยายามด้วยตนเอง
การดูแลสุขภาพกฎหมายและกระแสการทํางานของ Archiving
บันทึกงาน OCR คืนหรือสัปดาห์สําหรับบันทึกทางการแพทย์สัญญาหรือเอกสาร
การดําเนินงานทางการเงินและการปฏิบัติตาม
งานรายงานอัตโนมัติและการปฏิบัติตามที่ประมวลผลการสแกนขนาดใหญ่ในระยะเวลากลางวัน
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: การเริ่มต้นคู่มือที่ไม่น่าเชื่อถือ
โซลูชัน: ใช้เครื่องมือการวางแผนสําหรับงานที่ไม่คาดหวังเสมอ
ความท้าทาย 2: ความผิดพลาดในชุดขนาดใหญ่
โซลูชัน: การบันทึกอัตโนมัติและการจัดการข้อผิดพลาดเพื่อการทํางานที่แข็งแกร่ง
ความท้าทาย 3: Job Overlap หรือทรัพยากร จํากัด
**โซลูชัน: ** Stagger งานการตรวจสอบทรัพยากรและการแจ้งเตือนเกี่ยวกับความช้าหรือความล้มเหลว
การพิจารณาประสิทธิภาพ
- การตรวจสอบ CPU, ความจําและไดรฟ์ในระหว่างงานขนาดใหญ่
- ใช้บันทึกการผลิตและข้อผิดพลาดสําหรับการวิเคราะห์หลังการทํางาน
- งานแบทช์ควรได้รับการวางแผนกลางวันเพื่อหลีกเลี่ยงผลกระทบ
แนวทางที่ดีที่สุด
- งานทดสอบกับประเภทไฟล์และปริมาณที่แตกต่างกัน
- ตรวจสอบบันทึกสําหรับความล้มเหลวหรือประสิทธิภาพช้า
- การรักษาความปลอดภัยและจัดเก็บทั้งไฟล์แหล่งและส่งออก
- ปรับปรุงและบํารุงรักษาสคริปต์อัตโนมัติ
การ์ตูนขั้นสูง
สภาพแวดล้อม 1: คู่มือหรือกระจายงานแบทช์
ส่วนแบ่งงานผ่านเซิร์ฟเวอร์หลายหรือ VM สําหรับขนาด
ฉาก 2: การแจ้งเตือนในเวลาจริงเกี่ยวกับการเสร็จสิ้นงาน
ส่งอีเมลหรือแจ้งเตือน Webhook หลังจากเสร็จสิ้นงานที่วางแผน
ข้อสรุป
Aspose.OCR for .NET ช่วยให้การอัตโนมัติงาน OCR ที่แข็งแกร่งและไม่มีความคาดหวัง ด้วยการประมวลผลชุดและการวางแผนคุณสามารถรับประกันการไหลการทํางานในเวลาที่เชื่อถือได้และทนต่อข้อผิดพลาด Aspose.OCR สําหรับการอ้างอิง API .NET สําหรับบิตอัตโนมัติเคล็ดลับและรหัส