Kaip automatiškai apdoroti ir tvarkyti OCR darbo vietas naudojant Aspose.OCR
Daugiafunkcinis dokumentų darbo srautas reikalauja patikimos, nenumatytos OCR apdorojimo. „Aspose.OCR“ .NET palaiko visą pakuotės automatizavimą – monitoriaus failus, darbų tvarkaraštį, didelį tūrį ir atkūrimą nuo klaidų, kad būtų užtikrintas maksimalus efektyvumas.
Realaus pasaulio problemos
Verslas turi apdoroti tūkstančius skanintų failų kiekvieną naktį ar savaitę. rankinis ar interaktyvus OCR nesumažina ir padidina klaidų riziką. Automatija ir tvarkaraštis užtikrina, kad darbai veiktų patikimai, net nakties metu arba ne valandomis.
Sprendimo apžvalga
Sujungti Aspose.OCR pakuotės API, failų / failo stebėjimo ir tvarkaraščio įrankius (Darbo darbotvarkė, cron, ir tt) automatizuoti OCR laipsnyje.
Prerequisites
- „Visual Studio 2019“ arba vėliau
- .NET 6.0 arba naujesnė (arba .Net Framework 4.6.2+)
- ASPOSE.OCR už .NET iš NuGet
- „Windows Task Scheduler“, „Cron“ arba kiti darbo automatizavimo įrankiai
PM> Install-Package Aspose.OCR
Žingsnis po žingsnio įgyvendinimas
1 žingsnis: Įdiegti ir konfigūruoti Aspose.OCR
using Aspose.OCR;
2 žingsnis: Atskleisti failus Batch apdorojimui
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
3 žingsnis: paleiskite OCR į batus
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
4 žingsnis: Eksporto ir archyvų rezultatai
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
5 žingsnis: įrašyti užduotis ir klaidas
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
6 žingsnis: Automatinis tvarkaraštis (Windows Task Scheduler pavyzdys)
- Sukurkite „Batch“ failą arba „PowerShell“ scenarijų, kad galėtumėte atlikti savo OCR darbą pagal tvarkaraštį
- Naudokite užduočių tvarkaraštį paleisti kasdien, naktį arba paleidžiant
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
7 žingsnis: Išplėstinė – naujų failų stebėjimas
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
8 žingsnis: pilnas pavyzdys
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
Naudokite atvejus ir paraiškas
Įmonių pašto kambariai ir skaitmeniniai įrašai
Automatiškai apdoroti gaunamų dokumentų rinkinį be rankinių pastangų.
Sveikatos priežiūros, teisinės ir archyvo darbo srautas
Naktinis arba savaitinis OCR darbų tvarkaraštis medicinos įrašams, sutartims ar archyvams.
Finansinės ir atitikties operacijos
Automatinis ataskaitų teikimas ir atitikties darbai, kurie nagrinėja didelius skenavimo batus ne valandomis.
Bendrieji iššūkiai ir sprendimai
1 iššūkis: neįtikėtinas vadybinis pradžia
Išsprendimas: Visada naudokite programavimo įrankius nenumatytoms darbo vietoms.
2 iššūkis: klaidos dideliuose žaidimuose
Išsprendimas: Automatinis prisijungimas ir klaidų tvarkymas tvirtam veikimui.
Iššūkis 3: Darbo apribojimai arba išteklių ribojimas
Išsprendimas: Stagger darbo vietų, stebėti išteklius ir įspėti apie sulėtėjimus ar nesėkmes.
Veiksmingumo apžvalgos
- CPU, atminties ir disko stebėjimas didelio tūrio darbo metu
- Naudokite rezultatų ir klaidų logus po darbo analizei
- „Batch“ darbai turėtų būti planuojami ne valandomis, kad būtų išvengta poveikio
Geriausios praktikos
- Bandymų darbai su įvairių failų tipų ir tūrio
- Stebėkite logus dėl nesėkmių ar lėto veikimo
- Saugokite ir archyvuokite tiek šaltinio, tiek išeities failus
- Atnaujinti ir palaikyti automatizacijos scenarijus
Išplėstiniai scenarijai
1 scenarijus: palyginti ar paskirstyti batch darbo vietas
Skirstykite užduotis tarp kelių serverių arba VM laipsniu.
2 scenarijus: realaus laiko įspėjimai apie darbo užbaigimą
Siųskite el. Laišką arba žiniatinklio pranešimą po planuojamų darbų pabaigos.
Conclusion
Aspose.OCR .NET leidžia tvirtą, nenumatytą OCR darbo automatizavimą. su paketo apdorojimu ir tvarkymu galite užtikrinti laiku, patikimą ir klaidų atsparų darbo srautą. ASPOSE.OCR už .NET API nuorodą Batch automatizavimo patarimai ir kodas.