Як розпізнати рукописаний текст у зображеннях за допомогою Aspose.OCR
Ручно написані записи, форму входи та підписи знаходяться всюди в бізнесі, охороні здоров’я та освіті. Ручна транскрипція є повільною, несумісною і пляшкою для цифровизації. Aspose.OCR для .NET підтримує розпізнавання рукописаного тексту безпосередньо з зображень і сканів — автоматизований вхід, аудит і інтеграція робочого потоку.
Реальні проблеми світу
Критична інформація на паперових формах, рецептах, контрактах і ноутбуках часто існує тільки в якості рукопису. Введення цих даних вручну є сміливим, помилковим і дорогоцінним в масштабі.
Огляд рішення
Aspose.OCR для .NET забезпечує можливості розпізнавання рукопису, що дозволяє розробникам витягувати рукописаний контент з зображень і форм.
Передумови
- Visual Studio 2019 або вище
- .NET 6.0 або вище (або .Net Framework 4.6.2+)
- ASPOSE.OCR для .NET від NuGet
- Основні навички C#
PM> Install-Package Aspose.OCR
Крок за кроком реалізація
Крок 1: Завантажити та встановити Aspose.OCR
using Aspose.OCR;
Крок 2: Сканувати або фотографувати рукописані документи
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
Крок 3: Налаштування розпізнавання для рукопису
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Or match handwriting language
settings.DetectAreasMode = DetectAreasMode.HANDWRITING; // Important for handwritten text
Крок 4: Екстракт рукописаного тексту
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Крок 5: Експорт або підтвердження визнаного контенту
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
Крок 6: Додати обробку помилок та ручний огляд
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Post-process or review results
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Крок 7: Оптимізація стилів і якості рукопису
- Використовуйте високороздільні скани для кращої точності
- Препроцес (де-скев, зміцнює контраст) для слабкого або м’якого рукопису
- Тест на зразки рукопису від ваших типових користувачів
foreach (string file in Directory.GetFiles("./handwritten_samples", "*.jpg"))
{
input.Add(file);
}
Крок 8: Повний приклад
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.HANDWRITING;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Використання випадків та додатків
Здоров’я та рецепти
Цифровуйте рукописні медичні записи та рецепти для аудиту та пошуку.
Банківське та клієнтське обслуговування
Витяг підписів та заповнених форм полів для відкриття рахунку, дотримання або обробки кредиту.
Освіта та дослідження
Цифровуйте вручну написані ноти, тести або історичні документи для архівів або класифікації.
Спільні виклики та рішення
Виклик 1: слабкий або неконзистентний рукопис
Рішення: Заохочує кращі практики для рукопису; попередній процес зображень для чіткості.
Виклик 2: Низька роздільна здатність або шумний сканування
Рішення: Скануйте зображення на 300 ДПІ+ і відкиньте їх перед обробкою.
Виклик 3: змішаний друкований і рукописаний контент
Рішення: Використовуйте DetectAreasMode.AUTO або випробуйте обидва режими для оптимізації екстракції.
Виконання розглядів
- Використовуйте якісні, чисті скани
- Батч-процес для масштабів
- Затверджувати з людським оглядом, коли це можливо
Найкращі практики
- Визначення результатів за допомогою ручних точкових перевірок
- Tune DetectAreasMode для типових типів документів
- Забезпечити чутливі вручну написані дані
- Регулярно оновлюйте Aspose.OCR для кращих результатів
Розширені сценарії
Сценарій 1: Експорт до структурованих даних
foreach (RecognitionResult result in results)
{
result.Save("handwritten_output.json", SaveFormat.Json);
}
Сценарій 2: Батч-процес змішаних форм
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.AUTO; // For forms with both types
Заключення
ASPOSE.OCR для .NET дозволяє міцну екстракцію рукописаного тексту, підписів та записів, що допомагає вам з впевненістю цифровувати, аудитувати та автоматизувати робочі потоки.
Для найновіших функцій розпізнавання рукопису, дивіться Aspose.OCR для .NET API Референт .