Як автоматизувати вхід даних з форм з Aspose.OCR
Витяг інформації з паперових форм, анкет або опитувань є класичним введенням даних. з Aspose.OCR для .NET, ви можете цифровувати дані форми з сканів або фотографій, зменшуючи помилки і перетворюючи неструктуризовані документи в структуровані, модифіковані дани.
Реальні проблеми світу
Ручний формат введення даних повільний, дорогий, і дуже схильний до помилок – особливо у великих організаціях, досліджень або логістики. рукопис, різноманітні розташування та змішані типи поля роблять автоматизацію складною без потужних інструментів OCR.
Огляд рішення
ASPOSE.OCR для .NET забезпечує гнучкі налаштування розпізнавання для екстракції як друкованого, так і рукописаного тексту з форм, процесових контрольних ящиків, а також результатів зі структурою виходу – ідеально підходить для бізнесу, охорони здоров’я, людських ресурсів, освіти та багато іншого.
Передумови
Перед тим, як почати, переконайтеся, що у вас є:
- Visual Studio 2019 або вище
- .NET 6.0 або вище (або .Net Framework 4.6.2+)
- ASPOSE.OCR для .NET від NuGet
- Досвід C#
PM> Install-Package Aspose.OCR
Крок за кроком реалізація
Крок 1: Завантажити та встановити Aspose.OCR
using Aspose.OCR;
Крок 2: Скануйте або зображуйте свої форми
Підготуйте зображення форми (JPEG, PNG, PDF або TIFF). Ви можете додати кілька файлів для екстракції комплекту.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
Крок 3: Налаштування налаштувань пізнання
Налаштування для вивчення мови, розташування та (якщо це необхідно) рукопису.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
Крок 4: Виконайте процес вилучення даних
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Крок 5: Експорт або використання цифрових даних
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
Крок 6: Використання помилок
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Крок 7: Оптимізація для розкладу та рукопису
- Для рукописаних полів використовуйте більш високі сканування ДПІ та налаштування мови.
- Використовуйте DetectAreasMode.TABLE для табличних форм або DOCUMENT для різноманітних розташувань
- Тест з випробувальною формою для тунельних налаштувань
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
Крок 8: Повний приклад
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Використання випадків та додатків
Здоров’я та HR
Витяг і цифровизація форм даних для пацієнтів, робочих заявок або опитувань.
Дослідження та освіта
Автоматичне анкетування та обробка опитувань для більш швидкого аналізу.
Логістика та бізнес
Цифровуйте записи доставки, інспекційні форми або перевірки запасів.
Спільні виклики та рішення
Виклик 1: Ручно написані або низькоякісні поля
Рішення: Використовуйте високоякісні сканування і налаштуйте розпізнавання для рукопису.
Проблема 2: Нерегулярні формальні розташування
Рішення: Використовуйте режим ДОКУМЕНТ для складних розташувань, а також випробуйте на зразках.
Проблема 3: Екстракція батареї
Рішення: Використовуйте обробку комплекту, засновану на каталозі, для форм високого обсягу.
Виконання розглядів
- Бетч-процес для швидкості та скалативності
- Використання об’єктів ОКР після використання
- Використання продуктів до інтеграції
Найкращі практики
- Перевірка цифрових даних для точності перед автоматизацією
- Налаштування для кожного типу шаблону форми
- Архів оригіналу для аудиту
- Регулярно оновлюйте Aspose.OCR для поліпшення функцій
Розширені сценарії
Сценарій 1: Витяг ручного написання з форм
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
Сценарій 2: Експорт до JSON для імпорту бази даних
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
Заключення
ASPOSE.OCR для автомати .NET формує видобуток даних — видаляє ручний вхід і прискорює бізнес, дослідження або адміністративні робочі потоки.
Переглянути більш передові зразки використання та коду на Aspose.OCR для .NET API Референт .