Как распознать рукописный текст в изображениях с помощью Aspose.OCR
Рукописные записки, входы в форму и подписи находятся повсюду в бизнесе, здравоохранении и образовании. Ручная транскрипция медленна, несовместима и является бутылкой для цифровизации. Aspose.OCR для .NET поддерживает распознавание рукописного текста непосредственно из изображений и сканов — автоматического входа, аудита и интеграции рабочего потока.
Реальные мировые проблемы
Критическая информация о бумажных формах, рецептах, контрактах и ноутбуках часто существует только в виде рукописи. Ввод этих данных вручную является скучным, ошибочным и дорогостоящим по масштабу.
Решение обзор
Aspose.OCR для .NET предоставляет возможность распознавания рукописей, позволяя разработчикам извлечь рукописный контент из изображений и форм. Идеально подходит для цифрового архивирования, аудиторских трасс, здравоохранения и обслуживания клиентов.
Предупреждения
- Visual Studio 2019 или позднее
- .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
- ASPOSE.OCR для .NET от NuGet
- Основные навыки C#
PM> Install-Package Aspose.OCR
Step-by-Step реализация
Шаг 1: Инсталляция и настройка Aspose.OCR
using Aspose.OCR;
Шаг 2: Сканировать или фотографировать рукописанные документы
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
Шаг 3: Настройка распознавания для рукописи
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Or match handwriting language
settings.DetectAreasMode = DetectAreasMode.HANDWRITING; // Important for handwritten text
Шаг 4: Извлечение рукописного текста
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Шаг 5: Экспорт или подтверждение признанного контента
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
Шаг 6: Добавить обработку ошибок и руководящий отзыв
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Post-process or review results
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Шаг 7: Оптимизация стилей и качества рукописи
- Используйте сканирование высокого разрешения для наилучшей точности
- Препроцесс (де-скев, укрепляет контраст) для слабых или плохих рукописей
- Тест на образце рукописи от ваших типичных пользователей
foreach (string file in Directory.GetFiles("./handwritten_samples", "*.jpg"))
{
input.Add(file);
}
Шаг 8: Полный пример
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.HANDWRITING;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Используйте случаи и приложения
Здоровье и рецепты
Дигитализация ручнописанных медицинских записей и рецептов для аудита и поиска.
Банки и клиенты на борту
Экстракт подписей и заполненные формы поля для открытия счета, соблюдения, или обработки кредита.
Образование и исследования
Цифровывать рукописные ноты, тесты или исторические документы для архивов или класса.
Общие вызовы и решения
Проблема 1: плохой или несовместимый рукопись
Решение: Поощряет лучшие практики для рукописи; предварительные образы для четкости.
Проблема 2: низкое разрешение или шумный сканирование
*Решение: Сканирование на 300 ДПИ+ и отключение изображений перед обработкой.
Проблема 3: Смешанный печатный и рукописный контент
Решение: Используйте DetectAreasMode.AUTO или тестируйте оба режима для оптимизации экстракции.
Рассмотрим производительность
- Используйте качественные, чистые сканирования
- Батч-процесс для масштаба
- Подтвердить с помощью человеческого обзора, когда это возможно
Лучшие практики
- Валидируйте выходы с помощью ручных точковых проверок
- Tune DetectAreasMode для типичных типов документов
- Безопасные чувствительные рукописные данные
- Регулярно обновляется Aspose.OCR для лучших результатов
Развитые сценарии
Сценарий 1: Экспорт структурированных данных
foreach (RecognitionResult result in results)
{
result.Save("handwritten_output.json", SaveFormat.Json);
}
Сценарий 2: Батч-процесс смешанный формат формы
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.AUTO; // For forms with both types
Заключение
ASPOSE.OCR для .NET позволяет надежное извлечение рукописанного текста, подписей и записей, помогая вам с уверенностью цифровизировать, аудитовать и автоматизироваться рабочие потоки.
Для последних функций распознавания рукописи, см. ASPOSE.OCR для .NET API .