Как распознать рукописный текст в изображениях с помощью Aspose.OCR

Как распознать рукописный текст в изображениях с помощью Aspose.OCR

Рукописные записки, входы в форму и подписи находятся повсюду в бизнесе, здравоохранении и образовании. Ручная транскрипция медленна, несовместима и является бутылкой для цифровизации. Aspose.OCR для .NET поддерживает распознавание рукописного текста непосредственно из изображений и сканов — автоматического входа, аудита и интеграции рабочего потока.

Реальные мировые проблемы

Критическая информация о бумажных формах, рецептах, контрактах и ноутбуках часто существует только в виде рукописи. Ввод этих данных вручную является скучным, ошибочным и дорогостоящим по масштабу.

Решение обзор

Aspose.OCR для .NET предоставляет возможность распознавания рукописей, позволяя разработчикам извлечь рукописный контент из изображений и форм. Идеально подходит для цифрового архивирования, аудиторских трасс, здравоохранения и обслуживания клиентов.

Предупреждения

  • Visual Studio 2019 или позднее
  • .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
  • ASPOSE.OCR для .NET от NuGet
  • Основные навыки C#
PM> Install-Package Aspose.OCR

Step-by-Step реализация

Шаг 1: Инсталляция и настройка Aspose.OCR

using Aspose.OCR;

Шаг 2: Сканировать или фотографировать рукописанные документы

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");

Шаг 3: Настройка распознавания для рукописи

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Or match handwriting language
settings.DetectAreasMode = DetectAreasMode.HANDWRITING; // Important for handwritten text

Шаг 4: Извлечение рукописного текста

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Шаг 5: Экспорт или подтверждение признанного контента

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
    result.Save("handwritten_output.txt", SaveFormat.Text);
}

Шаг 6: Добавить обработку ошибок и руководящий отзыв

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Post-process or review results
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Шаг 7: Оптимизация стилей и качества рукописи

  • Используйте сканирование высокого разрешения для наилучшей точности
  • Препроцесс (де-скев, укрепляет контраст) для слабых или плохих рукописей
  • Тест на образце рукописи от ваших типичных пользователей
foreach (string file in Directory.GetFiles("./handwritten_samples", "*.jpg"))
{
    input.Add(file);
}

Шаг 8: Полный пример

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("handwritten_note.jpg");
            input.Add("signed_form.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.HANDWRITING;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("handwritten_output.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Используйте случаи и приложения

Здоровье и рецепты

Дигитализация ручнописанных медицинских записей и рецептов для аудита и поиска.

Банки и клиенты на борту

Экстракт подписей и заполненные формы поля для открытия счета, соблюдения, или обработки кредита.

Образование и исследования

Цифровывать рукописные ноты, тесты или исторические документы для архивов или класса.

Общие вызовы и решения

Проблема 1: плохой или несовместимый рукопись

Решение: Поощряет лучшие практики для рукописи; предварительные образы для четкости.

Проблема 2: низкое разрешение или шумный сканирование

*Решение: Сканирование на 300 ДПИ+ и отключение изображений перед обработкой.

Проблема 3: Смешанный печатный и рукописный контент

Решение: Используйте DetectAreasMode.AUTO или тестируйте оба режима для оптимизации экстракции.

Рассмотрим производительность

  • Используйте качественные, чистые сканирования
  • Батч-процесс для масштаба
  • Подтвердить с помощью человеческого обзора, когда это возможно

Лучшие практики

  • Валидируйте выходы с помощью ручных точковых проверок
  • Tune DetectAreasMode для типичных типов документов
  • Безопасные чувствительные рукописные данные
  • Регулярно обновляется Aspose.OCR для лучших результатов

Развитые сценарии

Сценарий 1: Экспорт структурированных данных

foreach (RecognitionResult result in results)
{
    result.Save("handwritten_output.json", SaveFormat.Json);
}

Сценарий 2: Батч-процесс смешанный формат формы

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.AUTO; // For forms with both types

Заключение

ASPOSE.OCR для .NET позволяет надежное извлечение рукописанного текста, подписей и записей, помогая вам с уверенностью цифровизировать, аудитовать и автоматизироваться рабочие потоки.

Для последних функций распознавания рукописи, см. ASPOSE.OCR для .NET API .

 Русский