Com exportar resultats OCR a múltiples formats utilitzant Aspose.OCR

Com exportar resultats OCR a múltiples formats utilitzant Aspose.OCR

Els fluxos de treball de negocis, legals i de conformitat sovint requereixen resultats OCR en múltiples formats digitals per a la integració, el reportatge i l’arxiu. Aspose.OCR per .NET proporciona una exportació flexible al format comú com TXT, DOCX, XLSX , PDF i JSON amb només una trucada de mètode.

El problema del món real

Les dades extraïdes a través de l’OCR han de ser compartides amb els col·legues, importades en ERP o eines BI, arxivades o processades més endavant.

Revisió de solucions

Aspose.OCR li permet triar el format de sortida per a cada resultat de reconeixement, ja sigui text pla, Word format, taules d’Excel, PDF buscable o JSON estructurat.

Prerequisits

  • Visual Studio 2019 o posterior
  • .NET 6.0 o posterior (o .Net Framework 4.6.2+)
  • Aspose.OCR per a .NET des de NuGet
  • Capacitat de programació C#
PM> Install-Package Aspose.OCR

Implementació de pas a pas

Pas 1: Instal·la i configura Aspose.OCR

using Aspose.OCR;

Pas 2: Reconeix text, taules o imatges

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Pas 3: Exportar resultats OCR a múltiples formats

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

Pas 4: Exportació de batxines automàtiques

Exportar totes les imatges processades d’una carpeta als formats desitjats:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

Pas 5: gestionar els errors i validar les exportacions

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

Pas 6: Integració amb els fluxos de treball baix

Utilitza els arxius exportats en:

  • Informació i BI dashboards (Excel, JSON)
  • Gestió de documents (PDF, DOCX)
  • Escriptes d’automatització (TXT i JSON)

Capítol 7: Exemple complet

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

Utilitzar casos i aplicacions

ERP/Integració de bases de dades

Importació de resultats Excel, JSON o TXT per a la publicació automàtica i la cerca.

Gestió i Arxiu de Documents

Crear registres buscables i compatibles en PDF, DOCX o TXT.

Informes empresarials

Popular BI dashboards o compartir resultats en múltiples formats.

Els reptes i les solucions comunes

Títol 1: Seleccionar el format adequat per a cada ús

** Solució:** Mapes de sortida per a les necessitats de negoci i el públic.

Challenge 2: Errors d’exportació o sobreescrits de fitxers

Solució: Afegeix verificacions d’existència de fitxers i noms timestampats.

Títol 3: Exportació de batxillerat a gran escala

Solució: Automatitzar i planificar les tasques de col·lecció; monitoritzar la salut de la carpeta d’exportació.

Consideracions de rendiment

  • Exportar grans fitxers a múltiples formats pot augmentar el temps de processament
  • Monitor d’espai de disc i estructura de mapes
  • Valida els arxius exportats regularment

Les millors pràctiques

  • Exportació de noms per a la traçabilitat i la recerca
  • Secure i còpia de seguretat dels arxius exportats
  • Test amb mostres de negocis del món real
  • Actualitza Aspose.OCR per a les últimes característiques d’exportació

Escenaris avançats

Escenari 1: Pasos de nom o d’exportació personalitzats

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

Escenari 2: Exportar només dades específiques (per exemple, taules)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

Conclusió

Aspose.OCR per a .NET facilita el lliurament de resultats OCR en els formats que requereixen els fluxos de treball, els col·legues i els sistemes, impulsant l’automatització, la participació i la integració amb mínim esforç.

Veure el Aspose.OCR per a .NET API Referència per últim en els formats d’exportació recolzats i característiques avançades.

 Català