Jak automatycznie wprowadzać dane z formularzy za pomocą Aspose.OCR

Jak automatycznie wprowadzać dane z formularzy za pomocą Aspose.OCR

Ekstrakcja informacji z formularzy papierowych, kwestionariuszy lub ankiet jest klasycznym elementem wejścia danych. z Aspose.OCR dla .NET można cyfrować dane formularza z skanowania lub zdjęć, zmniejszając błędy i przekształcając niestrukturyzowane dokumenty w strukturowane, edytowane dane.

Problem świata rzeczywistego

Wprowadzenie danych w formularzu ręcznym jest powolne, kosztowne i bardzo podatne na błędy – zwłaszcza w dużych organizacjach, badaniach lub logistyce. ręcznie pisanie, zróżnicowane układy i mieszane typy pola sprawiają, że automatyzacja jest trudna bez potężnych narzędzi OCR.

Przegląd rozwiązania

Aspose.OCR dla .NET zapewnia elastyczne ustawienia rozpoznawania do ekstrakcji zarówno tekstów typowanych i ręcznie napisanych z formularzy, skrzynek procesowych i wyników strukturowanych – idealne dla biznesu, opieki zdrowotnej, HR, edukacji i innych.

Warunki

Zanim zaczniesz, upewnij się, że masz:

  • Visual Studio 2019 lub później
  • .NET 6.0 lub nowszy (lub .Net Framework 4.6.2+)
  • Aspose.OCR dla .NET od NuGet
  • Podstawowe doświadczenie C#
PM> Install-Package Aspose.OCR

Wdrażanie krok po kroku

Krok 1: Instalacja i konfiguracja Aspose.OCR

using Aspose.OCR;

Krok 2: Skanuj lub fotografuj swoje formularze

Przygotuj zdjęcia formularza (JPEG, PNG, PDF lub TIFF). Możesz dodać kilka plików do ekstrakcji zestawu.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

Krok 3: Konfiguruj ustawienia rozpoznawania

Dostosuj ustawienia do wykrywania języka, układu i (jeśli to konieczne) ręcznego pisania.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

Krok 4: Wykonaj proces ekstrakcji danych

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Krok 5: Eksportowanie lub wykorzystanie danych cyfrowych

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

Krok 6: Dodaj rozwiązywanie błędów

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Krok 7: Optymalizuj rozkład i ręczne pisanie

  • W przypadku ręcznych pól użyj wyższych skanów DPI i dostosuj ustawienia języka
  • Użyj DetectAreasMode.TABLE dla formularzy tabularnych lub DOKUMENT dla różnych aranżacji
  • Test z próbkami do tonowania ustawień
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

Krok 8: Pełny przykład

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Korzystanie z przypadków i aplikacji

Opieka zdrowotna i HR

Ekstrakcja i cyfryzacja danych formularzy dla pacjentów, wniosków o pracę lub ankiet.

Badania i edukacja

Automatyczne przetwarzanie kwestionariuszy i ankiet dla szybszej analizy.

Logistyka i biznes

Digitalizuj notatki dostaw, formularze inspekcyjne lub listy kontrolne zapasów.

Wspólne wyzwania i rozwiązania

Wyzwanie 1: Ręcznie napisane lub niskiej jakości pola

Rozwiązanie: Użyj skanowania wysokiej jakości i dostosuj ustawienia rozpoznawania do ręcznego pisania.

Wyzwanie 2: nieregularne ustawienia form

Rozwiązanie: Użyj trybu dokumentów do złożonych układów i test na próbkach.

Wyzwanie 3: Batch Extraction

Rozwiązanie: Użyj przetwarzania zestawów opartych na adresatach dla formularzy o dużym objętości.

uwzględnienie wydajności

  • Proces batchowy dla prędkości i skalowalności
  • Dostarczanie obiektów OCR po użyciu
  • Potwierdzenie wydajności przed integracją

Najlepsze praktyki

  • Przegląd danych cyfrowych dla dokładności przed automatyzacją
  • Tune ustawienia dla każdego typu szablonu formularza
  • Archiwum oryginalne dla audytu
  • Aktualizuj Aspose.OCR regularnie dla ulepszeń funkcji

Zaawansowane scenariusze

Scenariusz 1: Wyciągnięcie ręcznego pisania z formularzy

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

Scenariusz 2: Eksport do JSON dla importu bazy danych

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

konkluzja

Aspose.OCR dla automatów .NET tworzy ekstrakcję danych – eliminuje wejście ręczne i przyspiesza przepływ pracy biznesowej, badawczej lub administracyjnej.

Zobacz więcej zaawansowanych próbek użytkowania i kodu w Aspose.OCR dla .NET API Referencje .

 Polski