Come creare un'applicazione Web di ricerca di testo immagine con Aspose.OCR

Come creare un'applicazione Web di ricerca di testo immagine con Aspose.OCR

Aggiungendo la ricerca di testo OCR alle applicazioni web può semplificare la conformità, l’e-discovery e la gestione dei beni digitali. Con Aspose.OCR Image Text Finder per .NET e ASP.NET Core, è possibile creare un’interfaccia user-friendly per la ricerche interattive e lo sguardo nelle immagini caricate.

Il problema del mondo reale

Gli utenti devono cercare immediatamente le parole chiave o i modelli all’interno delle immagini – senza scaricare o rivedere manualmente ogni scansione.

Soluzione Overview

Costruisci un Web UI per caricare immagini, eseguire le ricerche di parole chiave utilizzando OCR e riportare/esponere i risultati con evidenza in tempo reale.

Prerequisiti

  • Visual Studio 2019 o successivo
  • .NET 6.0 o successivo (ASP.NET Core)
  • Aspose.OCR per .NET da NuGet
  • Basic Razor Pages o esperienza MVC
PM> Install-Package Aspose.OCR
PM> dotnet add package Microsoft.AspNetCore.Mvc.Razor.RuntimeCompilation

Implementazione passo dopo passo

Scrivi una recensione per ASP.NET Core Web Project

dotnet new webapp -n ImageTextFinderWeb
cd ImageTextFinderWeb

Passo 2: Aggiungi UI di caricamento e ricerca (esempio Razor)

Aggiungi a Pages/Index.cshtml:

<form enctype="multipart/form-data" method="post">
    <input type="file" name="imageFile" />
    <input type="text" name="searchTerm" placeholder="Enter keyword or pattern" />
    <button type="submit">Search</button>
</form>
@if (Model.ResultText != null)
{
    <h3>Extracted Text:</h3>
    <pre>@Model.ResultText</pre>
    <h4>Found: @Model.KeywordFound</h4>
}

Passo 3: Gestire l’Upload, OCR e la logica di ricerca

Aggiungi a Pages/Index.cshtml.cs:

using Aspose.OCR;
public string ResultText { get; set; }
public bool KeywordFound { get; set; }
public async Task OnPostAsync(IFormFile imageFile, string searchTerm)
{
    if (imageFile != null && !string.IsNullOrWhiteSpace(searchTerm))
    {
        var filePath = Path.GetTempFileName();
        using (var stream = System.IO.File.Create(filePath))
            await imageFile.CopyToAsync(stream);
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        var result = ocr.Recognize(new OcrInput(InputType.SingleImage) { filePath }, settings)[0];
        ResultText = result.RecognitionText;
        KeywordFound = ocr.ImageHasText(filePath, searchTerm, settings);
        // Optional: highlight logic for UI
    }
}

Passo 4: evidenziare i risultati in UI (opzionale)

Utilizzare la sostituzione di stringhe di base o JavaScript per evidenziare visualmente le parole chiave trovate in ResultText.

Passo 5: Trattamento degli errori e sicurezza

  • Validare i tipi di file e limitare la dimensione di upload
  • Utilizzare try/catch per un’operazione robusta

Utilizzare casi e applicazioni

Compatibilità e e-discovery

Cerca immediatamente termini confidenziali all’interno degli upload durante la revisione.

Gestione dei Digital Asset

Permettere agli utenti di segnalare, rivedere o classificare gli attivi immagine su caricamento.

Servizio clienti

Lasciate che le squadre di supporto verifichino per PII o clausole speciali senza scaricare i documenti completi.

Sfide e soluzioni comuni

Sfida 1: Performance con grandi immagini

Soluzione: Limitare la dimensione del caricamento, ottimizzare la configurazione OCR, tagliare i lavori a lungo termine.

Sfida 2: Sicurezza e Validazione delle entrate

Soluzione: Validare i tipi di file e sanitare i risultati del testo.

Challenge 3: evidenziare i modelli complessi

Soluzione: Utilizzare regex o JavaScript per un match/highlight robusto.

Considerazioni di prestazioni

  • Discarica lavori di grandi dimensioni per il background processing
  • Utilizzare i file async IO e OCR per la rispondenza
  • Monitorare l’utilizzo del server

Migliori pratiche

  • Validare sempre gli upload
  • Limitare le dimensioni dei file e limitare i tipi
  • L’utente di registrazione cerca il percorso di audit
  • Sviluppo di HTTPS per la sicurezza

Scenari avanzati

Scenario 1: Batch Upload e Multi-Image Search

Lascia che gli utenti caricino diverse immagini, cerchi tutto e visualizzi i risultati di batch.

Scenario 2: Risultati di ricerca di risparmio/esportazione

Offre CSV scaricabili o uscite PDF evidenziate dall’UI.

conclusione

Con Aspose.OCR Image Text Finder e ASP.NET Core, è possibile fornire una ricerca di testo immagine interattiva e user-friendly per la conformità, la gestione dei beni digitali o gli strumenti facciati dal cliente.

See Aspose.OCR per .NET API Reference per ulteriori esempi di integrazione.

 Italiano