ASPOSE.OCRでフォームからデータ入力を自動化する方法

ASPOSE.OCRでフォームからデータ入力を自動化する方法

Aspose.OCR for .NET では、スキャンや写真からフォームデータをデジタル化し、エラーを減らし、構造化されていないドキュメントを編集可能なデータに変換することができます。

現実世界問題

マニュアルフォームデータ入力は遅く、高価で、特に大規模な組織、研究、またはロジスティクスでは、エラーに非常に敏感です 手書き、多様な配置、混合フィールドタイプは、強力なOCRツールなしで自動化を挑戦します。

ソリューション概要

Aspose.OCR for .NET は、フォーム、プロセスチェックボックス、および生産構造化された結果から書かれたテキストと手書きの両方を抽出するための柔軟な認識設定を提供します - ビジネス、医療、人事、教育などに最適です。

原則

始める前に、あなたが持っていることを確認してください:

  • Visual Studio 2019 以降
  • .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET から NuGet
  • 基本的なC#体験
PM> Install-Package Aspose.OCR

ステップ・ステップ・実施

ステップ1:インストールおよび設定 Aspose.OCR

using Aspose.OCR;

ステップ2:フォームをスキャンまたは撮影する

フォーム画像(JPEG、PNG、PDF、またはTIFF)を準備します。

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

ステップ3:認識設定を設定する

言語、レイアウト、および(必要に応じて)手書き検出の設定を調整します。

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

ステップ4:データ抽出プロセスを実行

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

ステップ5:デジタルデータの輸出または使用

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

ステップ6:エラー処理を追加する

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

ステップ7:レイアウトと手書きの最適化

  • 手書きフィールドでは、より高い DPI スキャンを使用し、言語設定を調整します。
  • テーブルフォームのための DetectAreasMode.TABLE を使用するか、多様なレイアウト用のドキュメント
  • サンプル形式でテストして、トゥーン設定
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

ステップ8:完璧な例

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ケースとアプリケーションの使用

医療・HR

患者入院、雇用申請、または調査のためのフォームデータを抽出およびデジタル化します。

研究と教育

迅速な分析のための自動問い合わせおよび調査処理。

物流とビジネス

配達ノート、検査フォーム、または記録チェックリストをデジタル化します。

共通の課題と解決策

課題1:手書きまたは低品質のフィールド

ソリューション: 高品質のスキャンを使用し、手書きの認識設定を調整します。

チャレンジ2:不規則な形状の配置

**ソリューション:**複雑なレイアウトのためのドキュメントモードを使用し、サンプルでテストします。

チャレンジ3:バッチ抽出

ソリューション: 高容量フォームのためのディレクトリベースのバッチ処理を使用します。

パフォーマンス考慮

  • スピードとスケール性のためのバッチプロセス
  • 使用後のOCRオブジェクトの配置
  • 統合前に生産を確認

ベストプラクティス

  • 自動化前の正確性のためのデジタルデータのレビュー
  • 各フォームテンプレートタイプのタンパク質設定
  • 監査のためのオリジナルアーカイブ
  • Aspose.OCR を定期的に更新し、機能の改善により

高度なシナリオ

シナリオ1:手書きの抽出

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

シナリオ2:データベース輸入のためのJSONへの輸出

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

結論

Aspose.OCR for .NET automates form data extraction—eliminating manual entry and accelerating business, research, or administrative workflows. データの抽出を形作り、手動入力を排除し、ビジネス、研究、または行政作業の流れを加速させます。

より先進的な使用とコードのサンプルを見る ASPOSE.OCR for .NET API リファレンス .

 日本語