Как автоматизировать обработку и планирование рабочих мест OCR с помощью Aspose.OCR
Массовые рабочие потоки документов требуют надежного, неожиданного обработки OCR. Aspose.OCR для .NET поддерживает полную автоматизацию пакетов — папки мониторинга, графические работы, обработку больших объемов и восстановление от ошибок для максимальной эффективности.
Реальные мировые проблемы
Бизнес должен обрабатывать тысячи сканированных файлов каждую ночь или неделю. Ручная или интерактивная OCR не скалирует и не увеличивает риск ошибок. Автоматизация и планирование гарантируют, что работы работают надежно, даже ночью или в оф-часах.
Решение обзор
Комбинировать Aspose.OCR пакет APIs, мониторинг файлов/файлов и программирование инструментов (Task Scheduler, cron, и т. д.) для автоматизации OCR по шкале.
Предупреждения
- Visual Studio 2019 или позднее
- .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
- ASPOSE.OCR для .NET от NuGet
- Windows Task Scheduler, cron или другие инструменты автоматизации работы
PM> Install-Package Aspose.OCR
Step-by-Step реализация
Шаг 1: Инсталляция и настройка Aspose.OCR
using Aspose.OCR;
Шаг 2: Найти файлы для обработки батарей
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
Шаг 3: Используйте OCR в батах
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Шаг 4: Экспорт и архивные результаты
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
Шаг 5: Регистрация рабочих мест и ошибок
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
Шаг 6: Автоматизированный график (пример Windows Task Scheduler)
- Создайте пакетный файл или скрипт PowerShell для выполнения работы OCR по графику
- Используйте график заданий, чтобы работать ежедневно, ночью или на выпуске
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
Шаг 7: Advanced — Мониторинг папки для новых файлов
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
Шаг 8: Полный пример
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
Используйте случаи и приложения
Корпоративные почтовые комнаты и цифровые коробки
Автоматически обрабатывают пачки входящих документов без ручных усилий.
Здоровье, правовые и архивные рабочие потоки
Планируйте ночные или еженедельные работы ОКР для медицинских записей, контрактов или архивов.
Финансовые и согласованные операции
Автоматизированные отчеты и выполнение работ, которые обрабатывают большие сканирующие батареи внечасовно.
Общие вызовы и решения
Проблема 1: Неуверенный ручный старт
Решение: Всегда используйте инструменты планирования для неожиданных рабочих мест.
Проблема 2: ошибки в больших матчах
Решение: Автоматическое запись и обработка ошибок для прочной работы.
Проблема 3: Обыкновенная работа или ограничения ресурсов
Решение: Стаггер рабочих мест, мониторинг ресурсов и предупреждение о замедлениях или провалах.
Рассмотрим производительность
- Мониторинг CPU, памяти и диска при работах высокого объема
- Используйте записи результатов и ошибок для анализа после работы
- Батч-работа должна быть запланирована внезапно, чтобы избежать последствий
Лучшие практики
- Тестные работы с различными типами файлов и объемами
- Мониторинг журналов для неудачи или медленной производительности
- Безопасность и архивирование как источника, так и выхода файлов
- Обновление и поддержание автоматических скриптов
Развитые сценарии
Сценарий 1: Параллелизировать или распределять рабочие места
Распределение рабочих мест на несколько серверов или VM по масштабу.
Сценарий 2: Реальные уведомления о завершении работы
Пожалуйста, отправьте сообщение по электронной почте или webhook после завершения запланированных работ.
Заключение
ASPOSE.OCR для .NET обеспечивает надежную, неожиданную автоматизацию работы OCR по шкале. С обработкой комплекта и планированием вы можете обеспечить своевременные, надежные и ошибочно устойчивые рабочие потоки. ASPOSE.OCR для .NET API Для автоматизации батарей и кода.