วิธีการรวม OCR ในการจัดการเอกสารและอัตโนมัติการทํางาน
องค์กรที่ทันสมัยต้องการการเข้าถึงข้อมูลที่รวดเร็วและอัตโนมัติในเอกสารสแกนอีเมลและภาพ การประมวลผลและส่งข้อมูลนี้ด้วยตนเองทําให้ธุรกิจชะลอการแนะนําข้อผิดพลาดและเพิ่มความเสี่ยงในการปฏิบัติตาม Aspose.OCR สําหรับ .NET ช่วยให้การรวม OCR ที่ไม่มีรอยต่อในระบบการจัดการเอกชน (DMS) และอัตราการทํางานของเอกลักษณ์ทั้งหมด
ปัญหาโลกจริง
ทีมกฎหมาย HR หรือทางการเงินต้องประมวลผลและดัชนีหลายพันเอกสารหรือรูปภาพที่สแกนเพื่อค้นหาการปฏิบัติตามหรือการทํางานของธุรกิจ การสกัดและอัปโหลดด้วยมือไปยัง DMS หรือเครื่องมือทํางานเป็นจุดสําคัญ
ความคิดเห็นเกี่ยวกับโซลูชัน
Aspose.OCR สําหรับ .NET สามารถรวมเข้ากับโซลูชั่นการอัตโนมัติของ DMS หรือ Workflow, ดูไฟล์ใหม่, สกัดเนื้อหาและส่งออกข้อความที่ได้รับการยอมรับไปยังฐานข้อมูลธุรกิจ APIs หรือคลาวด์
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
- การเข้าถึง DMS หรือ API workflow, database หรือการจัดเก็บคลาวด์
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR
using Aspose.OCR;
ขั้นตอนที่ 2: การตั้งค่าแหล่งป้อน (โฟลเดอร์คลาวด์หรือ API)
string inputFolder = "./scans";
foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
{
// Add to processing queue
}
ขั้นตอนที่ 3: ติดตั้งการประมวลผล OCR
OcrInput input = new OcrInput(InputType.PDF);
input.Add("document.pdf");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
ขั้นตอน 4: สารสกัดข้อความและส่งออกไปยัง DMS / Workflow
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
string text = result.RecognitionText;
// Export: Upload to API, save to DB, send to workflow, etc.
File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
}
ขั้นตอนที่ 5: การจัดการงานชุดข้อผิดพลาดและการแจ้งเตือน
try
{
// OCR and export code here
}
catch (Exception ex)
{
// Log or notify admin
Console.WriteLine($"Error: {ex.Message}");
}
ขั้นตอน 6: การบูรณาการกับธุรกิจ API หรือฐานข้อมูล
- ใช้ ADO.NET, Entity Framework หรือ REST API ลูกค้าสําหรับการส่งออก
- ส่งการแจ้งเตือนหรือเว็บฮ็อคหลังจากการประมวลผล
// Example pseudo-code for REST API upload
// UploadToDmsApi(text, metadata);
ขั้นตอน 7: ปรับปรุงความปลอดภัยและการปฏิบัติตาม
- ข้อมูลการรักษาความปลอดภัยถูกเข้ารหัสในระหว่างการขนส่งและการพักผ่อน
- เพิ่มบันทึกการตรวจสอบสําหรับ OCR และกิจกรรมการส่งออกทั้งหมด
ขั้นตอน 8: Monitor, Scale และ Automate
- ใช้บริการพื้นหลังคอยหรือตารางสําหรับงานขนาดใหญ่
- ตรวจสอบโฟลเดอร์การส่งออกและสถานะงาน
// Example: FileSystemWatcher to trigger on new files
// new FileSystemWatcher("./scans")
ขั้นตอน 9: ตัวอย่างสมบูรณ์ (Batch Automation)
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./scans";
OcrInput input = new OcrInput(InputType.PDF);
foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
string text = result.RecognitionText;
File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
// Optionally export to database or API
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
ใช้กรณีและแอปพลิเคชัน
อัตโนมัติ Onboarding
การประมวลผลอัตโนมัติและจัดเก็บสัญญาแบบฟอร์มและเอกสาร ID ใน DMS ของคุณ
บัญชีและบัญชีอัตโนมัติที่ชําระเงิน
extract และ push บัญชีข้อมูลโดยตรง into your ERP, AP, หรือ workflow engine.
สอดคล้องและความพร้อมในการตรวจสอบ
OCR อัตโนมัติและส่งออกสําหรับเอกสารการปฏิบัติตามขนาดใหญ่และรายงาน
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: การโหลดเอกสารขนาดใหญ่ Bursty
โซลูชัน: ใช้คิวส์พนักงานพื้นหลังและวางแผนงานในระยะเวลากลางวัน
ความท้าทาย 2: API หรือข้อผิดพลาดการส่งออก
โซลูชัน: เพิ่มการยกเลิกการเข้าสู่ระบบและการแจ้งเตือนข้อบกพร่อง
ความท้าทาย 3: การจัดการข้อมูลที่ไวต่อความลับ
โซลูชัน: การเข้ารหัสข้อมูลการ จํากัด การเข้าถึงและการตรวจสอบกิจกรรมทั้งหมด
การพิจารณาประสิทธิภาพ
- งานแบทช์อาจต้องสแกน (CPU, I/O)
- การตรวจสอบประสิทธิภาพของระบบและการส่งออก
- มีวัตถุ OCR และเชื่อมต่อ DB / API ปิด
แนวทางที่ดีที่สุด
- ผลการส่งออกที่ถูกต้องตามความต้องการทางธุรกิจ
- ปรับปรุงการขึ้นอยู่และตั้งค่าความปลอดภัยทั้งหมดเป็นประจํา
- รายละเอียดและตรวจสอบขั้นตอนการอัตโนมัติทั้งหมด
- สภาพแวดล้อมการทดสอบ / Dev และการผลิตที่แยกต่างหาก
การ์ตูนขั้นสูง
ฉาก 1: การรวมคลาวด์
ดาวน์โหลดผล OCR ไปยัง Cloud DMS (SharePoint, Google Drive, ฯลฯ)
Scenario 2: อัตราการทํางานในเวลาจริง Triggers
กระแสการทํางานหรือแจ้งเตือนลดลงทันทีที่ข้อความใหม่จะได้รับการยอมรับ
ข้อสรุป
Aspose.OCR สําหรับ .NET ปรับปรุงการบูรณาการกับกระแสทํางานของธุรกิจและแพลตฟอร์ม DMS ช่วยให้คุณสามารถอัตโนมัติการสกัดข้อมูลและการจัดการเอกสารด้วยรหัสขั้นต่ํา
สําหรับการอัตโนมัติขั้นสูงและตัวอย่าง API เยี่ยมชม Aspose.OCR สําหรับการอ้างอิง API .NET .