Как автоматизировать обработку и планирование рабочих мест OCR с помощью Aspose.OCR

Как автоматизировать обработку и планирование рабочих мест OCR с помощью Aspose.OCR

Массовые рабочие потоки документов требуют надежного, неожиданного обработки OCR. Aspose.OCR для .NET поддерживает полную автоматизацию пакетов — папки мониторинга, графические работы, обработку больших объемов и восстановление от ошибок для максимальной эффективности.

Реальные мировые проблемы

Бизнес должен обрабатывать тысячи сканированных файлов каждую ночь или неделю. Ручная или интерактивная OCR не скалирует и не увеличивает риск ошибок. Автоматизация и планирование гарантируют, что работы работают надежно, даже ночью или в оф-часах.

Решение обзор

Комбинировать Aspose.OCR пакет APIs, мониторинг файлов/файлов и программирование инструментов (Task Scheduler, cron, и т. д.) для автоматизации OCR по шкале.

Предупреждения

  • Visual Studio 2019 или позднее
  • .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
  • ASPOSE.OCR для .NET от NuGet
  • Windows Task Scheduler, cron или другие инструменты автоматизации работы
PM> Install-Package Aspose.OCR

Step-by-Step реализация

Шаг 1: Инсталляция и настройка Aspose.OCR

using Aspose.OCR;

Шаг 2: Найти файлы для обработки батарей

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

Шаг 3: Используйте OCR в батах

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Шаг 4: Экспорт и архивные результаты

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

Шаг 5: Регистрация рабочих мест и ошибок

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

Шаг 6: Автоматизированный график (пример Windows Task Scheduler)

  • Создайте пакетный файл или скрипт PowerShell для выполнения работы OCR по графику
  • Используйте график заданий, чтобы работать ежедневно, ночью или на выпуске
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

Шаг 7: Advanced — Мониторинг папки для новых файлов

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

Шаг 8: Полный пример

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Используйте случаи и приложения

Корпоративные почтовые комнаты и цифровые коробки

Автоматически обрабатывают пачки входящих документов без ручных усилий.

Здоровье, правовые и архивные рабочие потоки

Планируйте ночные или еженедельные работы ОКР для медицинских записей, контрактов или архивов.

Финансовые и согласованные операции

Автоматизированные отчеты и выполнение работ, которые обрабатывают большие сканирующие батареи внечасовно.

Общие вызовы и решения

Проблема 1: Неуверенный ручный старт

Решение: Всегда используйте инструменты планирования для неожиданных рабочих мест.

Проблема 2: ошибки в больших матчах

Решение: Автоматическое запись и обработка ошибок для прочной работы.

Проблема 3: Обыкновенная работа или ограничения ресурсов

Решение: Стаггер рабочих мест, мониторинг ресурсов и предупреждение о замедлениях или провалах.

Рассмотрим производительность

  • Мониторинг CPU, памяти и диска при работах высокого объема
  • Используйте записи результатов и ошибок для анализа после работы
  • Батч-работа должна быть запланирована внезапно, чтобы избежать последствий

Лучшие практики

  • Тестные работы с различными типами файлов и объемами
  • Мониторинг журналов для неудачи или медленной производительности
  • Безопасность и архивирование как источника, так и выхода файлов
  • Обновление и поддержание автоматических скриптов

Развитые сценарии

Сценарий 1: Параллелизировать или распределять рабочие места

Распределение рабочих мест на несколько серверов или VM по масштабу.

Сценарий 2: Реальные уведомления о завершении работы

Пожалуйста, отправьте сообщение по электронной почте или webhook после завершения запланированных работ.

Заключение

ASPOSE.OCR для .NET обеспечивает надежную, неожиданную автоматизацию работы OCR по шкале. С обработкой комплекта и планированием вы можете обеспечить своевременные, надежные и ошибочно устойчивые рабочие потоки. ASPOSE.OCR для .NET API Для автоматизации батарей и кода.

 Русский