如何使用 Aspose.OCR 自动化包装处理和 OCR 工作时间表

如何使用 Aspose.OCR 自动化包装处理和 OCR 工作时间表

Aspose.OCR for .NET 支持完整的集合自动化 - 显示文件夹,时间表工作,处理大容量,并从错误中恢复,以获得最大效率。

现实世界问题

企业必须每晚或每周处理成千上万的扫描文件. 手动或互动的OCR不会扩展,并增加错误风险。

解决方案概述

将 ASPOSE.OCR 组合的 APIs、文件/文件夹监控和编程工具(任务日程表、Cron 等)结合起来,以自动化 OCR 的规模。

原則

  • Visual Studio 2019 或以后
  • .NET 6.0 或更高版本(或 .Net Framework 4.6.2+)
  • Aspose.OCR 为 .NET 从 NuGet
  • (可选) Windows Task Scheduler、Cron 或其他工作自动化工具
PM> Install-Package Aspose.OCR

步骤实施

步骤 1: 安装和设置 Aspose.OCR

using Aspose.OCR;

步骤2:查找Batch处理文件

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

步骤3:运行 OCR 在 包装中

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

步骤4:出口和档案结果

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

步骤5:记录工作和错误

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

步骤6:自动安排(Windows Task Scheduler 示例)

  • 创建一个包文件或 PowerShell 脚本,以便在时间表上运行您的 OCR 工作
  • 使用 Task Scheduler 每天、夜间或在启动器上运行
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

步骤7:先进 - 新文件的文件夹监控

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

步骤8:完整的例子

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

使用案例和应用程序

公司邮局和数字输入箱

自动处理输入文件的集合,没有手动努力。

医疗保健、法律和档案工作流

夜间或每周安排医疗记录、合同或档案的OCR工作。

财务和遵守操作

自动报告和遵守工作,处理大型扫描包在时间外。

共同挑战与解决方案

挑战1:不可靠的手动启动

** 解決方案:** 總是使用計劃工具未預期工作。

挑战2:大战中的错误

** 解决方案:** 自动登录和错误处理,以便有效运行。

挑战3:工作过度或资源限制

** 解决方案:** Stagger 工作,监控资源,并警告缓慢或失败。

绩效考虑

  • 监控CPU、内存和磁盘高容量工作
  • 使用输出和错误记录后工作分析
  • 巴奇工作应该在时间外安排,以避免影响

最佳实践

  • 测试工作与不同的文件类型和容量
  • 监控失败或缓慢性能的日志
  • 安全和存档源和输出文件
  • 更新和维护自动化脚本

先进的场景

场景1:平行或分配Batch工作

将工作分为多个服务器或VM的规模。

剧本2:实时工作完成警报

在完成计划工作后发送电子邮件或webhook通知。

结论

Aspose.OCR for .NET 可在规模上进行强大、无期望的 OCR 工作自动化. 通过集合处理和时间表,您可以提供及时、可靠、错误耐用的工作流。 ASPOSE.OCR 为 .NET API 参考 用于包装自动化提示和代码。

 中文