Comment exporter les résultats OCR à plusieurs formats en utilisant Aspose.OCR

Comment exporter les résultats OCR à plusieurs formats en utilisant Aspose.OCR

Les flux de travail d’affaires, juridiques et de conformité nécessitent souvent des résultats OCR dans plusieurs formats numériques pour l’intégration, la déclaration et l’archivage. Aspose.OCR pour .NET fournit une exportation flexible à des formulaires communs tels que TXT, DOCX, XLS X, PDF et JSON avec un seul appel de méthode.

Problème du monde réel

Les données extraites via OCR doivent être partagées avec les collègues, importées dans les ERP ou les outils BI, archivées ou traitées ultérieurement.

Vue de la solution

Aspose.OCR vous permet de choisir le format de sortie pour chaque résultat de reconnaissance – qu’il s’agisse de texte plain, Word formaté, Excel tables, PDF recherchable, ou JSON structuré. l’exportation est simple, flexible et intégrée avec des flux de travail automatisés.

Principaux

  • Visual Studio 2019 ou ultérieur
  • .NET 6.0 ou ultérieur (ou .Net Framework 4.6.2+)
  • Aspose.OCR pour .NET de NuGet
  • Les compétences de programmation C#
PM> Install-Package Aspose.OCR

La mise en œuvre étape par étape

Étape 1 : Installer et configurer Aspose.OCR

using Aspose.OCR;

Étape 2: Reconnaître le texte, les tables ou les images

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Étape 3 : Exporter les résultats OCR à plusieurs formats

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

Étape 4 : Exportation automatique

Exporter toutes les images traitées d’un dossier aux formats souhaités :

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

Étape 5 : Traiter les erreurs et valider les exportations

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

Étape 6: Intégrer avec les flux de travail Downstream

Utilisez les fichiers exportés dans :

  • Informations et dashboards BI (Excel, JSON)
  • Gestion des documents (PDF, DOCX)
  • Les scripts d’automatisation (TXT, JSON)

Étape 7 : Exemple complet

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

Utiliser les cas et les applications

Intégration des bases de données / ERP

Importer les outils Excel, JSON ou TXT pour la publication et la recherche automatiques.

Gestion et archivation de documents

Créer des dossiers recherchables et conformes en PDF, DOCX ou TXT.

Rapport d’affaires

Des dashboards BI populaires ou des résultats partagés dans plusieurs formats.

Défis communs et solutions

Défi 1 : Choisir le bon format pour chaque utilisation

Résolution: Les sorties de cartes répondent aux exigences d’entreprise et au public.

Défi 2 : Erreurs d’exportation ou surécriture de fichiers

Solution: Ajoutez les vérifications d’existence des fichiers et les noms timestampés.

Défi 3 : les exportations de batch à grande échelle

Solution: Automatiser et planifier les tâches de groupe; surveiller la santé des dossiers d’exportation.

Considérations de performance

  • Exporter de grands fichiers à plusieurs formats peut augmenter le temps de traitement
  • Monitoriser l’espace disque et la structure des dossiers
  • Valider les fichiers exportés régulièrement

Migliori pratiche

  • Exportation de noms pour la traçabilité et la recherche
  • Sécuriser et sauvegarder les fichiers exportés
  • Test avec des échantillons d’affaires du monde réel
  • Mise à jour Aspose.OCR pour les dernières fonctionnalités d’exportation

Scénarios avancés

Scénario 1 : Nomination personnalisée ou itinéraires d’exportation

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

Scénario 2: Exporter uniquement des données spécifiques (par exemple des tables)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

Conclusion

Aspose.OCR pour .NET facilite la livraison des résultats OCR dans les formats dont vous avez besoin vos flux de travail, vos collègues et vos systèmes – améliorant l’automatisation, le partage et l’intégration avec un effort minimal.

Voir le Aspose.OCR pour la référence API .NET pour le plus récent sur les formats d’exportation soutenus et les fonctionnalités avancées.

 Français