Comment automatiser l'entrée de données des formulaires avec Aspose.OCR

Comment automatiser l'entrée de données des formulaires avec Aspose.OCR

L’extraction d’informations à partir de formulaires papier, de questionnaires ou de sondages est une bouteille classique pour l’entrée de données. Avec Aspose.OCR pour .NET, vous pouvez digitaliser les données de formulaire à travers les scans ou les photos, réduire les erreurs et transformer les documents non structurés en données strukturées et édifiables.

Problème du monde réel

L’entrée de données de formulaire manuel est lente, coûteuse et très susceptible d’erreurs - en particulier dans les grandes organisations, la recherche ou la logistique. l’écriture manuelle, les réglages variés et les types de champ mélangés rendent l’automatisation difficile sans puissants outils OCR.

Vue de la solution

Aspose.OCR pour .NET fournit des paramètres de reconnaissance flexibles pour extraire les textes imprimés et écrits à la fois des formulaires, des boîtes de vérification de processus et des résultats structurés - idéal pour les affaires, la santé, les ressources humaines, l’éducation et plus encore.

Principaux

Avant de commencer, assurez-vous que vous avez :

  • Visual Studio 2019 ou ultérieur
  • .NET 6.0 ou ultérieur (ou .Net Framework 4.6.2+)
  • Aspose.OCR pour .NET de NuGet
  • L’expérience C#
PM> Install-Package Aspose.OCR

La mise en œuvre étape par étape

Étape 1 : Installer et configurer Aspose.OCR

using Aspose.OCR;

Étape 2 : scanner ou photographier vos formulaires

Préparez vos images de formulaire (JPEG, PNG, PDF, ou TIFF).

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

Étape 3 : Configurer les paramètres de reconnaissance

Ajuster les paramètres pour la détection du langage, du layout et (si nécessaire) de l’écriture manuelle.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

Étape 4 : Exécuter le processus d’extraction de données

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Étape 5 : Exporter ou utiliser des données numériques

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

Étape 6 : Ajoutez le traitement des erreurs

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Étape 7 : Optimiser le layout et l’écriture manuelle

  • Pour les champs manuscrits, utilisez des scans DPI plus élevés et ajustez les paramètres de langue
  • Utilisez DetectAreasMode.TABLE pour les formulaires de table, ou DOCUMENT pour des layouts variés
  • Test avec les formulaires d’échantillons pour tonner les paramètres
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

Étape 8 : Exemple complet

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Utiliser les cas et les applications

Santé et HR

Extrait et numérisation des données de formulaire pour la prise de patient, les demandes d’emploi ou les sondages.

Recherche et éducation

Traitement automatique des questionnaires et des enquêtes pour une analyse plus rapide.

Logistique et Business

Digitalisez les notes de livraison, les formulaires d’inspection ou les listes de vérification des enregistrements.

Défis communs et solutions

Défi 1 : les champs manuels ou de faible qualité

Solution: Utilisez des scans de haute qualité et ajustez les paramètres de reconnaissance pour l’écriture manuelle.

Défi 2 : Layouts de forme irréguliers

Solution: Utilisez le mode DOCUMENT pour des layouts complexes, et testez sur des échantillons.

Défi 3 : l’extraction de batch

Résolution: Utilisez le traitement de catégories pour les formulaires de volume élevé.

Considérations de performance

  • Le processus de batch pour la vitesse et l’escalabilité
  • Déposer des objets OCR après utilisation
  • Valider la production avant l’intégration

Migliori pratiche

  • Analyse des données numérisées pour la précision avant l’automatisation
  • Tune des paramètres pour chaque type de modèle de formulaire
  • Archives originales pour l’audit
  • Mettre à jour Aspose.OCR régulièrement pour des améliorations de fonctionnalités

Scénarios avancés

Scénario 1 : extraire l’écriture manuelle des formulaires

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

Scénario 2: Exportation à JSON pour l’importation de base de données

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

Conclusion

Aspose.OCR pour les automatismes .NET forme l’extraction de données – éliminant la entrée manuelle et accélérant les flux de travail d’affaires, de recherche ou administratif.

Voir des échantillons d’utilisation et de code plus avancés sur Aspose.OCR pour la référence API .NET .

 Français