OCRをドキュメント管理とワークフロー自動化に統合する方法

OCRをドキュメント管理とワークフロー自動化に統合する方法

現代の組織は、スキャンされた文書、電子メール、および画像の情報への迅速かつ自動的なアクセスを要求します. このデータを手動で処理し入力することは、ビジネスを遅らせ、エラーを導入し、遵守リスクを増加させる。

現実世界問題

法律、人事、あるいは財務チームは、検索、遵守、またはビジネスワークフローのための何千ものスキャンされた文書や画像を迅速に処理し、インデックスしなければなりません。

ソリューション概要

Aspose.OCR for .NET は、DMS またはワークフロー自動化ソリューションに組み込まれ、新しいファイルを監視し、コンテンツを抽出したり、自動的にビジネスデータベース、API、またはクラウドストレージに認識されたテキストを輸出することができます。

原則

  • Visual Studio 2019 以降
  • .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET から NuGet
  • DMSまたはワークフロー API、データベース、またはクラウドストレージへのアクセス
PM> Install-Package Aspose.OCR

ステップ・ステップ・実施

ステップ1:インストールおよび設定 Aspose.OCR

using Aspose.OCR;

ステップ2:入力ソース(フォルダー、クラウド、またはAPI)を設定する

string inputFolder = "./scans";
foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
{
    // Add to processing queue
}

ステップ3:OCR処理の設定

OcrInput input = new OcrInput(InputType.PDF);
input.Add("document.pdf");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;

ステップ4:DMS/Workflowにテキストとエクスポートを抽出

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
    string text = result.RecognitionText;
    // Export: Upload to API, save to DB, send to workflow, etc.
    File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
}

ステップ5:バッチの仕事、エラー、および通知を処理する

try
{
    // OCR and export code here
}
catch (Exception ex)
{
    // Log or notify admin
    Console.WriteLine($"Error: {ex.Message}");
}

ステップ6:ビジネスAPIやデータベースと統合する

  • ADO.NET、Entity Framework、またはREST API クライアントを使用して輸出します。
  • 処理後に通知またはWebhooksを送信する
// Example pseudo-code for REST API upload
// UploadToDmsApi(text, metadata);

ステップ7:セキュリティと遵守のための最適化

  • セキュリティデータは、トランジットおよび休憩時に暗号化されます。
  • すべてのOCRおよび輸出行動の監査記録を追加する

ステップ8:モニター、スケール、自動化

  • 大規模な仕事のための背景サービス、カウンター、またはスケジュールを使用する
  • 出力フォルダーと仕事の状態を監視する
// Example: FileSystemWatcher to trigger on new files
// new FileSystemWatcher("./scans")

ステップ9:完全な例(バッチ自動化)

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./scans";
            OcrInput input = new OcrInput(InputType.PDF);
            foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            foreach (RecognitionResult result in results)
            {
                string text = result.RecognitionText;
                File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
                // Optionally export to database or API
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ケースとアプリケーションの使用

自動上陸

自動処理およびあなたのDMSに契約、フォーム、ID文書を保存します。

請求書およびアカウントの有料自動化

請求書データを ERP、AP、またはワークフローエンジンに直接抽出して押します。

遵守と監査の準備

大規模な遵守文書アーカイブおよび報告のための自動 OCR と輸出。

共通の課題と解決策

チャレンジ1:大規模、ブルースティドキュメントロード

**ソリューション:**カウンター、背景労働者、オフタイムの仕事のスケジュールを使用します。

課題2:APIまたはエクスポートエラー

ソリューション: 返信、ログイン、および失敗通知を追加します。

課題3:敏感・機密データ処理

ソリューション: データを暗号化し、アクセスを制限して、すべてのアクションを監査します。

パフォーマンス考慮

  • バッチワークはスケーリングを必要とする可能性があります(CPU、I/O)
  • システムパフォーマンスと出力コインのモニタリング
  • OCR オブジェクトと DB/API 接続を閉じる

ベストプラクティス

  • ビジネス要件に対する輸出結果の認証
  • 定期的に、すべての依存とセキュリティ設定を更新します。
  • ドキュメンタリーおよびすべての自動化ステップの監視
  • 別々のテスト/デビューおよび生産環境

高度なシナリオ

シナリオ1:クラウド統合

OCRの結果をクラウドDMS(SharePoint、Google Driveなど)にアップロードします。

シナリオ2:リアルタイムワークフロートリガー

新しいテキストが認識される直後にダウンストリームのワークフローやアラームを刺激します。

結論

Aspose.OCR for .NET は、ビジネスワークフローや DMS プラットフォームとの統合を簡素化し、最小限のコードで情報抽出と文書処理を自動化できます。

高度な自動化およびAPIサンプルについては、 ASPOSE.OCR for .NET API リファレンス .

 日本語