Kaip sukurti vaizdo teksto paieškos programą su Aspose.OCR

Kaip sukurti vaizdo teksto paieškos programą su Aspose.OCR

Pridėjus OCR palaikytą teksto paiešką į žiniatinklio programas, galima supaprastinti atitiktį, elektroninį atradimą ir skaitmeninio turto valdymą. su Aspose.OCR Image Text Finder .NET ir ASP.NET Core, galite sukurti naudotojo draugišką sąsają interaktyviam paieška ir pabrėžiant įkeltus vaizdus.

Realaus pasaulio problemos

Vartotojai turi nedelsiant ieškoti raktinių žodžių ar pavyzdžių nuotraukose – be atsisiųsti ar rankiniu būdu peržiūrėti kiekvieną skenavimą.Interaktyviosios programos taupo laiką ir sumažina praleistų duomenų riziką.

Sprendimo apžvalga

Sukurkite žiniatinklio sąsają, kad būtų galima įkelti vaizdus, atlikti raktinių žodžių paiešką naudojant OCR ir grąžinti / eksponuoti rezultatus su realaus laiko pabrėžimu.

Prerequisites

  • „Visual Studio 2019“ arba vėliau
  • .NET 6.0 arba naujesnė (ASP.NET Core)
  • ASPOSE.OCR už .NET iš NuGet
  • Pagrindiniai Razor puslapiai arba MVC patirtis
PM> Install-Package Aspose.OCR
PM> dotnet add package Microsoft.AspNetCore.Mvc.Razor.RuntimeCompilation

Žingsnis po žingsnio įgyvendinimas

1 žingsnis: įdiegti ASP.NET Core Web projektą

dotnet new webapp -n ImageTextFinderWeb
cd ImageTextFinderWeb

2 žingsnis: Pridėti įkrovimo ir paieškos UI (Razor pavyzdys)

Pridėti į Pages/Index.cshtml:

<form enctype="multipart/form-data" method="post">
    <input type="file" name="imageFile" />
    <input type="text" name="searchTerm" placeholder="Enter keyword or pattern" />
    <button type="submit">Search</button>
</form>
@if (Model.ResultText != null)
{
    <h3>Extracted Text:</h3>
    <pre>@Model.ResultText</pre>
    <h4>Found: @Model.KeywordFound</h4>
}

3 žingsnis: tvarkykite įkrovimą, OCR ir paieškos logiką

Pridėti į Pages/Index.cshtml.cs:

using Aspose.OCR;
public string ResultText { get; set; }
public bool KeywordFound { get; set; }
public async Task OnPostAsync(IFormFile imageFile, string searchTerm)
{
    if (imageFile != null && !string.IsNullOrWhiteSpace(searchTerm))
    {
        var filePath = Path.GetTempFileName();
        using (var stream = System.IO.File.Create(filePath))
            await imageFile.CopyToAsync(stream);
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        var result = ocr.Recognize(new OcrInput(InputType.SingleImage) { filePath }, settings)[0];
        ResultText = result.RecognitionText;
        KeywordFound = ocr.ImageHasText(filePath, searchTerm, settings);
        // Optional: highlight logic for UI
    }
}

4 žingsnis: pabrėžti UI rezultatus (pasirenkamas)

Naudokite pagrindinį sričių pakeitimą arba JavaScript, kad vizualiai pabrėžtumėte rasti raktinius žodžius ResultText.

5 žingsnis: klaidų tvarkymas ir saugumas

  • Įvertinkite failų tipus ir apribokite įkrovimo dydį
  • Naudokite try/catch už tvirtą veikimą

Naudokite atvejus ir paraiškas

Atitiktis ir e-atradimas

Nedelsiant ieškokite konfidencialių terminų peržiūrų metu.

Skaitmeninio turto valdymas

Padėti vartotojams pažymėti, peržiūrėti arba klasifikuoti vaizdo turtą įkeliant.

Klientų aptarnavimas

Leiskite palaikymo komandoms patikrinti PII ar specialias sąlygas, neleisdamos išsamių dokumentų.

Bendrieji iššūkiai ir sprendimai

1 iššūkis: spektaklis su dideliais vaizdais

Išsprendimas: Apriboti įkrovimo dydį, optimizuoti OCR konfigūraciją, užfiksuoti ilgalaikius darbus.

2 iššūkis: saugumas ir įvesties patvirtinimas

Išsprendimas: Įvertinkite failų tipus ir išsaugokite teksto rezultatus.

Iššūkis 3: pabrėžti sudėtingus modelius

Išsprendimas: Naudokite regex arba JavaScript, kad galėtumėte užtikrinti tvirtą rungtį / aukštą šviesą.

Veiksmingumo apžvalgos

  • Iškrauti didelius darbus į foninį apdorojimą
  • Naudokite async failus IO ir OCR atsakomybės
  • Serverio išteklių naudojimo stebėjimas

Geriausios praktikos

  • Visada patvirtinkite įkrovimus
  • Ribotas failų dydis ir ribotos rūšys
  • Registracijos vartotojas ieško audito maršruto
  • Atsisiųskite HTTPS saugumui

Išplėstiniai scenarijai

1 scenarijus: „Batch Upload“ ir „Multi-Image“ paieškos

Leiskite vartotojams įkelti keletą vaizdų, ieškoti visų ir peržiūrėti batch rezultatus.

2 scenarijus: išsaugoti / eksportuoti paieškos rezultatus

Siūlome atsisiunčiamus CSV arba pabrėžtus PDF išėjimus iš UI.

Conclusion

Su „Aspose.OCR Image Text Finder“ ir „ASP.NET Core“ galite pristatyti naudotojams patogią, interaktyvią vaizdo teksto paiešką atitikties, skaitmeninio turto valdymo ar klientų atžvilgiu įrankiams.

See ASPOSE.OCR už .NET API nuorodą papildomų integracijos pavyzdžių.

 Lietuvių