Come automatizzare il trattamento e la programmazione dei posti di lavoro OCR utilizzando Aspose.OCR

Come automatizzare il trattamento e la programmazione dei posti di lavoro OCR utilizzando Aspose.OCR

Aspose.OCR per .NET supporta l’automazione del pacchetto completo - cartelle di monitor, lavori di calendario, processi di grandi volumi e recupero da errori per la massima efficienza.

Il problema del mondo reale

Le aziende devono elaborare migliaia di file scansionati ogni notte o settimana.OCR manuale o interattiva non scala e aumenta il rischio di errore.L’automazione e la programmazione assicurano che i lavori funzionino in modo affidabile, anche durante la sera o in ore fuori.

Soluzione Overview

Combina Aspose.OCR batch API, file/file monitoring, e strumenti di programmazione (Task Scheduler, cron, ecc.) per automatizzare OCR a scala. Monitorare per nuovi file, il processo in batches, ed esportare i risultati ai formati e archivi desiderati.

Prerequisiti

  • Visual Studio 2019 o successivo
  • .NET 6.0 o successivo (o .Net Framework 4.6.2+)
  • Aspose.OCR per .NET da NuGet
  • (Opzionale) Windows Task Scheduler, cron o altri strumenti di automazione del lavoro
PM> Install-Package Aspose.OCR

Implementazione passo dopo passo

Passo 1: Installare e configurare Aspose.OCR

using Aspose.OCR;

Passo 2: Scopri i file per il trattamento di batch

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

Passo 3: Eseguire OCR in batch

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Passo 4: Risultati di esportazione e archiviazione

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

Passo 5: Registrare posti di lavoro e errori

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

Passo 6: Programmazione automatica (esempio di Windows Task Scheduler)

  • Crea un file di batch o script PowerShell per eseguire il tuo lavoro OCR su un calendario
  • Utilizzare Task Scheduler per eseguire quotidianamente, di notte o sul trigger
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

Passo 7: Advanced – Monitoraggio dei file per i nuovi file

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

Passo 8 - Esempio completo

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Utilizzare casi e applicazioni

Postali aziendali e registratori digitali

Processare automaticamente i pacchetti di documenti in arrivo senza sforzo manuale.

Servizi sanitari, legali e flussi di lavoro di archiviazione

Pianificare i lavori OCR notturni o settimanali per registri medici, contratti o archivi.

Operazioni finanziarie e di conformità

Lavori di segnalazione automatica e di conformità che elaborano grandi scansioni off-hours.

Sfide e soluzioni comuni

Titolo originale: Uncredible Manual Start

Soluzione: Utilizzare sempre gli strumenti di programmazione per posti di lavoro non attesi.

Challenge 2: errori in grandi battaglie

Soluzione: Logging automatico e gestione degli errori per funzionamento robusto.

Challenge 3: L’offerta di lavoro o le restrizioni delle risorse

Soluzione: Stagger posti di lavoro, monitorare le risorse e avvertire sul rallentamento o sul fallimento.

Considerazioni di prestazioni

  • Monitorare la CPU, la memoria e il disco durante i lavori ad alto volume
  • Utilizzare i log di uscita e errore per l’analisi post-job
  • I lavori di batch dovrebbero essere pianificati off-hours per evitare un impatto

Migliori pratiche

  • Lavori di prova con vari tipi di file e volumi
  • Monitorare i log per fallimenti o prestazioni lente
  • Proteggere e archiviare sia i file di fonte che di output
  • Aggiornare e mantenere gli script di automazione

Scenari avanzati

Scenario 1: Parallelizzare o distribuire i lavori di batch

Dividere i posti di lavoro su più server o VM per scala.

Scenario 2: Allarme in tempo reale sulla conclusione del lavoro

Invia e-mail o notifica webhook dopo la conclusione dei lavori programmati.

conclusione

Aspose.OCR per .NET consente un’automazione robusta e non attesa del lavoro OCR a scala.Con il processamento e la programmazione dei pacchetti, è possibile garantire flussi di lavoro tempestivi, affidabili e resistenti agli errori. Aspose.OCR per .NET API Reference per i suggerimenti e il codice di automatizzazione di batch.

 Italiano