Bagaimana untuk mengautomatikkan pemprosesan batch dan jadual pekerjaan OCR menggunakan Aspose.OCR

Bagaimana untuk mengautomatikkan pemprosesan batch dan jadual pekerjaan OCR menggunakan Aspose.OCR

Aliran kerja dokumen besar memerlukan pemprosesan OCR yang boleh dipercayai dan tidak dijangka. Aspose.OCR untuk .NET menyokong automatik batch penuh - folder pemantauan, kerja jadual, proses volum besar, dan pemulihan daripada kesilapan untuk kecekapan maksimum.

Masalah dunia sebenar

Perniagaan perlu memproses beribu-ribu fail yang disemak setiap malam atau minggu.OCR manual atau interaktif tidak mengukur dan meningkatkan risiko kesilapan.Automasi dan jadual memastikan kerja berjalan dengan boleh dipercayai, walaupun sepanjang hari atau di luar jam.

Gambaran keseluruhan penyelesaian

Menggabungkan Aspose.OCR batch APIs, pemantauan fail/folder, dan alat jadual (Task Scheduler, cron, dll) untuk mengautomatikkan OCR pada skala. memantau fail baru, proses dalam batches dan mengeksport hasil ke format dan arkib yang dikehendaki.

Prerequisites

  • Visual Studio 2019 atau seterusnya
  • .NET 6.0 atau lebih baru (atau .Net Framework 4.6.2+)
  • Aspose.OCR untuk .NET daripada NuGet
  • (Pilihan) Windows Task Scheduler, cron, atau alat automatik kerja lain
PM> Install-Package Aspose.OCR

Pelaksanaan langkah demi langkah

Langkah 1: Pemasangan dan Konfigurasi Aspose.OCR

using Aspose.OCR;

Langkah 2: Temukan fail untuk pemprosesan batch

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

Langkah 3: Melancarkan OCR dalam batch

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Langkah 4: Eksport dan Hasil Arkib

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

Langkah 5: Log Pekerjaan dan Kesilapan

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

Langkah 6: Jadual automatik (Windows Task Scheduler Contoh)

  • Mencipta fail batch atau skrip PowerShell untuk menjalankan kerja OCR anda pada jadual
  • Gunakan Task Scheduler untuk menjalankan setiap hari, malam, atau pada trigger
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

Langkah 7: Lanjutan – Pemantauan folder untuk fail baru

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

Langkah 8 : Contoh Lengkap

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Penggunaan Kasus dan Permohonan

Bilik pos korporat dan kotak masuk digital

Secara automatik memproses batch dokumen masuk tanpa usaha manual.

Penjagaan Kesihatan, Undang-undang, dan Arsip Aliran Kerja

Jadual kerja OCR malam atau mingguan untuk rekod perubatan, kontrak, atau arkib.

Operasi kewangan dan pematuhan

Laporan automatik dan kerja-kerja pematuhan yang memproses batch pemindaian besar di luar jam.

Tantangan dan Penyelesaian Bersama

Tantangan 1: Pelancaran manual yang tidak boleh dipercayai

** Penyelesaian:** Sentiasa gunakan alat jadual untuk pekerjaan yang tidak dijangka.

Tantangan 2: Kesilapan dalam Pertempuran Besar

** Penyelesaian:** Log dan pemprosesan ralat secara automatik untuk operasi yang kukuh.

Tantangan 3: Pengurangan pekerjaan atau kekurangan sumber

** Penyelesaian:** Stagger pekerjaan, memantau sumber, dan memberi amaran mengenai perlambatan atau kegagalan.

Pertimbangan prestasi

  • Memantau CPU, memori, dan cakera semasa kerja volum tinggi
  • Menggunakan log output dan ralat untuk analisis post-job
  • Pekerjaan batch perlu dirancang off-hours untuk mengelakkan kesan

amalan terbaik

  • Kerja-kerja ujian dengan pelbagai jenis fail dan volum
  • Memantau log untuk kegagalan atau prestasi perlahan
  • Menjaga dan mengarkibkan kedua-dua fail sumber dan output
  • Mengemas kini dan mengekalkan skrip automatik

Senario lanjutan

Skenario 1: Membandingkan atau membahagikan pekerjaan batch

Membahagikan pekerjaan di pelbagai pelayan atau VM untuk skala.

Scenario 2: Peringatan masa nyata mengenai penyelesaian pekerjaan

Hantar e-mel atau pemberitahuan webhook selepas kerja-kerja yang dijadualkan selesai.

Conclusion

Aspose.OCR untuk .NET membolehkan automatik kerja OCR yang kukuh dan tidak dijangka pada skala.Dengan pemprosesan batch dan jadual, anda boleh memastikan aliran kerja yang tepat pada masanya, boleh dipercayai dan tahan kesilapan.Lihat Aspose.OCR untuk .NET API Rujukan untuk tips dan kod automatik batch.

 Melayu