Comment exporter les résultats OCR à plusieurs formats en utilisant Aspose.OCR
Les flux de travail d’affaires, juridiques et de conformité nécessitent souvent des résultats OCR dans plusieurs formats numériques pour l’intégration, la déclaration et l’archivage. Aspose.OCR pour .NET fournit une exportation flexible à des formulaires communs tels que TXT, DOCX, XLS X, PDF et JSON avec un seul appel de méthode.
Problème du monde réel
Les données extraites via OCR doivent être partagées avec les collègues, importées dans les ERP ou les outils BI, archivées ou traitées ultérieurement.
Vue de la solution
Aspose.OCR vous permet de choisir le format de sortie pour chaque résultat de reconnaissance – qu’il s’agisse de texte plain, Word formaté, Excel tables, PDF recherchable, ou JSON structuré. l’exportation est simple, flexible et intégrée avec des flux de travail automatisés.
Principaux
- Visual Studio 2019 ou ultérieur
- .NET 6.0 ou ultérieur (ou .Net Framework 4.6.2+)
- Aspose.OCR pour .NET de NuGet
- Les compétences de programmation C#
PM> Install-Package Aspose.OCR
La mise en œuvre étape par étape
Étape 1 : Installer et configurer Aspose.OCR
using Aspose.OCR;
Étape 2: Reconnaître le texte, les tables ou les images
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Étape 3 : Exporter les résultats OCR à plusieurs formats
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
Étape 4 : Exportation automatique
Exporter toutes les images traitées d’un dossier aux formats souhaités :
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
Étape 5 : Traiter les erreurs et valider les exportations
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
Étape 6: Intégrer avec les flux de travail Downstream
Utilisez les fichiers exportés dans :
- Informations et dashboards BI (Excel, JSON)
- Gestion des documents (PDF, DOCX)
- Les scripts d’automatisation (TXT, JSON)
Étape 7 : Exemple complet
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
Utiliser les cas et les applications
Intégration des bases de données / ERP
Importer les outils Excel, JSON ou TXT pour la publication et la recherche automatiques.
Gestion et archivation de documents
Créer des dossiers recherchables et conformes en PDF, DOCX ou TXT.
Rapport d’affaires
Des dashboards BI populaires ou des résultats partagés dans plusieurs formats.
Défis communs et solutions
Défi 1 : Choisir le bon format pour chaque utilisation
Résolution: Les sorties de cartes répondent aux exigences d’entreprise et au public.
Défi 2 : Erreurs d’exportation ou surécriture de fichiers
Solution: Ajoutez les vérifications d’existence des fichiers et les noms timestampés.
Défi 3 : les exportations de batch à grande échelle
Solution: Automatiser et planifier les tâches de groupe; surveiller la santé des dossiers d’exportation.
Considérations de performance
- Exporter de grands fichiers à plusieurs formats peut augmenter le temps de traitement
- Monitoriser l’espace disque et la structure des dossiers
- Valider les fichiers exportés régulièrement
Migliori pratiche
- Exportation de noms pour la traçabilité et la recherche
- Sécuriser et sauvegarder les fichiers exportés
- Test avec des échantillons d’affaires du monde réel
- Mise à jour Aspose.OCR pour les dernières fonctionnalités d’exportation
Scénarios avancés
Scénario 1 : Nomination personnalisée ou itinéraires d’exportation
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
Scénario 2: Exporter uniquement des données spécifiques (par exemple des tables)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
Conclusion
Aspose.OCR pour .NET facilite la livraison des résultats OCR dans les formats dont vous avez besoin vos flux de travail, vos collègues et vos systèmes – améliorant l’automatisation, le partage et l’intégration avec un effort minimal.
Voir le Aspose.OCR pour la référence API .NET pour le plus récent sur les formats d’exportation soutenus et les fonctionnalités avancées.