Comment reconnaître le texte manuscrit dans les images en utilisant Aspose.OCR
Les notes manuscrites, les entrées de formulaire et les signatures sont partout dans les affaires, la santé et l’éducation. la transcription manuelle est lente, inconsistante et un bouteille pour la numérisation. Aspose.OCR pour .NET soutient la reconnaissance du texte manuscrite directement à partir des images et des scans - entrée automatique, audit et intégration du flux de travail.
Problème du monde réel
Les informations critiques sur les formulaires de papier, les prescriptions, le contrat et les notebooks ne existent souvent que en tant qu’écriture manuelle. l’introduction de ces données à la main est tendue, trompeuse, et coûteuse à échelon.
Vue de la solution
Aspose.OCR pour .NET fournit des capacités de reconnaissance manuelle, permettant aux développeurs d’extraire du contenu manuellement écrit des images et des formulaires. il est parfait pour l’archivage numérique, les trails d’audit, la santé et le client onboarding.
Principaux
- Visual Studio 2019 ou ultérieur
- .NET 6.0 ou ultérieur (ou .Net Framework 4.6.2+)
- Aspose.OCR pour .NET de NuGet
- Les compétences C#
PM> Install-Package Aspose.OCR
La mise en œuvre étape par étape
Étape 1 : Installer et configurer Aspose.OCR
using Aspose.OCR;
Étape 2 : Scanner ou photographier des documents manuscrits
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
Étape 3: Configurer la reconnaissance pour l’écriture manuelle
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Or match handwriting language
settings.DetectAreasMode = DetectAreasMode.HANDWRITING; // Important for handwritten text
Étape 4 : extraire le texte manuscrit
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Étape 5 : Exporter ou valider le contenu reconnu
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
Étape 6: Ajoutez le traitement des erreurs et la révision manuelle
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Post-process or review results
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Étape 7 : Optimiser pour les styles d’écriture manuelle et la qualité
- Utilisez des scans de haute résolution pour la meilleure précision
- Pré-procédure (de-squew, améliore le contraste) pour l’écriture manuelle faible ou méchante
- Test sur l’écriture d’échantillon de vos utilisateurs typiques
foreach (string file in Directory.GetFiles("./handwritten_samples", "*.jpg"))
{
input.Add(file);
}
Étape 8 : Exemple complet
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.HANDWRITING;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Utiliser les cas et les applications
Soins de santé et prescriptions
Digitaliser les dossiers médicaux manuscrits et les prescriptions pour l’audit et la recherche.
Banque et client onboarding
Extraire les signatures et les champs de formulaire remplis pour l’ouverture d’un compte, la conformité ou le traitement du prêt.
Éducation et recherche
Digitalisez les notes manuscrites, les tests ou les documents historiques pour les archives ou le classement.
Défis communs et solutions
Défi 1 : L’écriture manuelle faible ou incohérente
Solution: Encourage les meilleures pratiques pour l’écriture manuelle; images pré-processées pour la clarté.
Défi 2 : scans de faible résolution ou de bruit
Résolution: Scan à 300 DPI+ et découvrez les images avant le traitement.
Défi 3 : contenu imprimé et manuscrit mélangé
Solution: Utilisez DetectAreasMode.AUTO ou testez les deux modes pour optimiser l’extraction.
Considérations de performance
- Utilisez des scans de bonne qualité et nettoyés
- Le processus de batch pour l’échelle
- Valider avec l’analyse humaine quand possible
Migliori pratiche
- Valider les sorties avec des vérifications manuelles
- Tune DetectAreasMode pour vos types de documents typiques
- Les données manuellement écrite sensibles
- Actualiser régulièrement Aspose.OCR pour les meilleurs résultats
Scénarios avancés
Scénario 1 : Exportation des données structurées
foreach (RecognitionResult result in results)
{
result.Save("handwritten_output.json", SaveFormat.Json);
}
Scénario 2 : Processus de batch formats mixtes
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.AUTO; // For forms with both types
Conclusion
Aspose.OCR pour .NET permet une extraction robuste de texte manuscrit, de signatures et de notes – vous aidant à numériser, à auditer et à automatiser les flux de travail avec confiance.
Pour les dernières caractéristiques de reconnaissance manuelle, voir le Aspose.OCR pour la référence API .NET .