Come esportare i risultati OCR in più formati utilizzando Aspose.OCR

Come esportare i risultati OCR in più formati utilizzando Aspose.OCR

I flussi di lavoro aziendali, legali e di conformità spesso richiedono risultati OCR in più formati digitali per l’integrazione, la segnalazione e il archiviazione. Aspose.OCR per .NET fornisce esportazioni flessibili a formate comuni come TXT, DOCX, XLS X, PDF e JSON con solo una chiamata di metodo.

Il problema del mondo reale

I dati estratti tramite OCR devono essere condivisi con i colleghi, importati in strumenti ERP o BI, archiviati o elaborati ulteriormente.

Soluzione Overview

Aspose.OCR ti consente di scegliere il formato di uscita per ogni risultato di riconoscimento, sia che si tratti di testo piatto, Word formattato, tabelle Excel, PDF di ricerca o JSON strutturato.

Prerequisiti

  • Visual Studio 2019 o successivo
  • .NET 6.0 o successivo (o .Net Framework 4.6.2+)
  • Aspose.OCR per .NET da NuGet
  • Le competenze di programmazione C#
PM> Install-Package Aspose.OCR

Implementazione passo dopo passo

Passo 1: Installare e configurare Aspose.OCR

using Aspose.OCR;

Passo 2: Riconoscere testo, tabelle o immagini

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Passo 3: Esportare i risultati OCR in molti formati

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

Passo 4: Automatizzare l’esportazione

Esportare tutte le immagini elaborate da una cartella ai formati desiderati:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

Passo 5: gestire gli errori e valutare le esportazioni

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

Passo 6: Integrare con i flussi di lavoro Downstream

Utilizzare i file esportati in:

  • Rapporto e dashboard BI (Excel, JSON)
  • Gestione dei documenti (PDF, DOCX)
  • Scritti di automazione (TXT, JSON)

Passo 7 - Esempio completo

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

Utilizzare casi e applicazioni

Integrazione di database/ERP

Importare Excel, JSON o TXT per la pubblicazione automatica e la ricerca.

Gestione e archiviazione dei documenti

Creare file di ricerca, compatibili in PDF, DOCX o TXT.

Rapporto aziendale

Popolare BI dashboards o condividere i risultati in più formati.

Sfide e soluzioni comuni

sfida 1: scegliere il formato giusto per ogni utilizzo

Soluzione: Mappa delle uscite alle esigenze aziendali e al pubblico.

Challenge 2: errori di esportazione o sovrapposizioni di file

Soluzione: Aggiungi i controlli di esistenza del file e i nomi timestampati.

Challenge 3: le esportazioni di batch a grande scala

Soluzione: Automatizzare e pianificare i lavori di batch; monitorare la salute della cartella di esportazione.

Considerazioni di prestazioni

  • L’esportazione di grandi file in più formati può aumentare il tempo di elaborazione
  • Monitorare lo spazio del disco e la struttura della cartella
  • Validare regolarmente i file esportati

Migliori pratiche

  • Nome esportazioni per tracciabilità e ricerca
  • Sicuro e backup dei file esportati
  • Test con campioni di business del mondo reale
  • Aggiornare Aspose.OCR per le ultime funzionalità di esportazione

Scenari avanzati

Scenario 1: Nomi personalizzati o percorsi di esportazione

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

Scenario 2: Esportare solo dati specifici (ad esempio tabelle)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

conclusione

Aspose.OCR per .NET facilita la consegna dei risultati OCR nei formati di cui i flussi di lavoro, i colleghi e i sistemi hanno bisogno, stimolando l’automazione, la condivisione e l’integrazione con un minimo di sforzo.

Vedi il Aspose.OCR per .NET API Reference per il più recente su formati di esportazione supportati e funzionalità avanzate.

 Italiano