如何使用 Aspose.OCR 自动化包装处理和 OCR 工作时间表
如何使用 Aspose.OCR 自动化包装处理和 OCR 工作时间表
Aspose.OCR for .NET 支持完整的集合自动化 - 显示文件夹,时间表工作,处理大容量,并从错误中恢复,以获得最大效率。
现实世界问题
企业必须每晚或每周处理成千上万的扫描文件. 手动或互动的OCR不会扩展,并增加错误风险。
解决方案概述
将 ASPOSE.OCR 组合的 APIs、文件/文件夹监控和编程工具(任务日程表、Cron 等)结合起来,以自动化 OCR 的规模。
原則
- Visual Studio 2019 或以后
- .NET 6.0 或更高版本(或 .Net Framework 4.6.2+)
- Aspose.OCR 为 .NET 从 NuGet
- (可选) Windows Task Scheduler、Cron 或其他工作自动化工具
PM> Install-Package Aspose.OCR
步骤实施
步骤 1: 安装和设置 Aspose.OCR
using Aspose.OCR;
步骤2:查找Batch处理文件
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
步骤3:运行 OCR 在 包装中
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
步骤4:出口和档案结果
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
步骤5:记录工作和错误
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
步骤6:自动安排(Windows Task Scheduler 示例)
- 创建一个包文件或 PowerShell 脚本,以便在时间表上运行您的 OCR 工作
- 使用 Task Scheduler 每天、夜间或在启动器上运行
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
步骤7:先进 - 新文件的文件夹监控
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
步骤8:完整的例子
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
使用案例和应用程序
公司邮局和数字输入箱
自动处理输入文件的集合,没有手动努力。
医疗保健、法律和档案工作流
夜间或每周安排医疗记录、合同或档案的OCR工作。
财务和遵守操作
自动报告和遵守工作,处理大型扫描包在时间外。
共同挑战与解决方案
挑战1:不可靠的手动启动
** 解決方案:** 總是使用計劃工具未預期工作。
挑战2:大战中的错误
** 解决方案:** 自动登录和错误处理,以便有效运行。
挑战3:工作过度或资源限制
** 解决方案:** Stagger 工作,监控资源,并警告缓慢或失败。
绩效考虑
- 监控CPU、内存和磁盘高容量工作
- 使用输出和错误记录后工作分析
- 巴奇工作应该在时间外安排,以避免影响
最佳实践
- 测试工作与不同的文件类型和容量
- 监控失败或缓慢性能的日志
- 安全和存档源和输出文件
- 更新和维护自动化脚本
先进的场景
场景1:平行或分配Batch工作
将工作分为多个服务器或VM的规模。
剧本2:实时工作完成警报
在完成计划工作后发送电子邮件或webhook通知。
结论
Aspose.OCR for .NET 可在规模上进行强大、无期望的 OCR 工作自动化. 通过集合处理和时间表,您可以提供及时、可靠、错误耐用的工作流。 ASPOSE.OCR 为 .NET API 参考 用于包装自动化提示和代码。