Kā automātiski apstrādāt un plānot OCR darba vietas, izmantojot Aspose.OCR
Bulk dokumentu darba plūsmas prasa uzticamu, negaidītu OCR apstrādi. Aspose.OCR for .NET atbalsta pilnīgu batch automāciju – monitoru mapes, grafiku darbavietas, lielu apjomu apstrāde un atgūšana no kļūdām maksimālā efektivitāte.
Reālā pasaules problēma
Uzņēmumiem ir jāapstrādā tūkstošiem skenēto failu katru nakti vai nedēļu. rokasgrāmata vai interaktīvā OCR nesaskaņo un palielina kļūdu risku. Automātika un plānošana nodrošina, ka darbavietas darbojas uzticami, pat naktī vai ārā.
Risinājumu pārskats
Kombinēt Aspose.OCR batch API, failu/foldera uzraudzību un plānošanas rīkus (Darbības kalendārs, cron, utt.) automātiski OCR skalā. monitorēt jaunus failus, apstrādāt batches, un eksportēt rezultātus uz vēlamo formātu un arhīvu.
Prerequisites
- Visual Studio 2019 vai vēlāk
- .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
- Aspose.OCR par .NET no NuGet
- Windows Task Scheduler, cron vai citi darba automācijas rīki
PM> Install-Package Aspose.OCR
Step-by-step īstenošana
1. solis: Uzstādīt un konfigurēt Aspose.OCR
using Aspose.OCR;
2. solis: Atrodiet failus Batch apstrādei
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
3. solis: Run OCR batches
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
4. solis: Eksporta un arhīva rezultāti
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
5. solis: ierakstiet darba vietas un kļūdas
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
6. solis: Automātiskā plānošana (Windows uzdevumu plānošanas piemērs)
- Izveidojiet batch failu vai PowerShell skriptu, lai veiktu savu OCR darbu uz grafiku
- Izmantojiet uzdevumu programmatūru, lai veiktu katru dienu, naktī vai uz starta
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
7. solis: Advanced – Folder monitoring for New Files
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
8. solis: pilns piemērs
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
Izmantojiet gadījumus un pieteikumus
Uzņēmumu pasta telpas un digitālie ieraksti
Automātiski apstrādā ienākošo dokumentu komplektus bez manuāliem centieniem.
Veselības aprūpe, likumdošana un darba plūsmas arhivēšana
Naktī vai nedēļā plānojiet OCR darbus medicīniskajiem ierakstiem, līgumiem vai arhīviem.
Finanšu un atbilstības operācijas
Automātiskā ziņošanas un atbilstības darbi, kas apstrādā lielus skenēšanas batumus ārpus stundām.
Kopīgi izaicinājumi un risinājumi
1. izaicinājums: neticams rokasgrāmata
Rīkojums: Vienmēr izmantojiet plānošanas rīkus negaidītajiem darbiem.
2. izaicinājums: kļūdas lielos spēkos
Rīkojums: Automātiskā ieraksta un kļūdu apstrāde, lai nodrošinātu stabilu darbību.
3. izaicinājums: darba pārpalikums vai resursu ierobežojumi
Lēmums: Stagger darbavietas, resursi monitorēšana un brīdinājums par kavējumiem vai neveiksmēm.
Darbības apsvērumi
- Pārraidiet CPU, atmiņu un disku augsta apjoma darba laikā
- Izmantojiet rezultātu un kļūdu logus pēc darba analīzei
- Batch darbavietas ir jāsaglabā off-hours, lai izvairītos no ietekmes
Labākās prakses
- Testēšanas darbi ar dažādiem failu veidiem un apjomiem
- Pārrauga failus vai lēnu veiktspēju
- Aizsargāt un arhivēt gan avotu, gan izejas failus
- Atjaunināt un uzturēt automātisko skriptu
Augstākie scenāriji
1. scenārijs: paralēli vai izplatīt batch darba vietas
Nodarbību sadalīšana starp vairākiem serveriem vai VM mērogā.
Scenārija 2: Reālā laika brīdinājumi par darba pabeigšanu
Sūtīt e-pastu vai webhook paziņojumu pēc plānotās darba pabeigšanas.
Conclusion
Aspose.OCR for .NET ļauj spēcīgu, negaidītu OCR darba automātismu skalā. ar komplekta apstrādi un plānošanu, jūs varat nodrošināt savlaicīgus, uzticamus un kļūdas pretestus darba plūsmas. Aspose.OCR par .NET API atsauci par batch automācijas ieteikumiem un kodu.