OCRをドキュメント管理とワークフロー自動化に統合する方法
現代の組織は、スキャンされた文書、電子メール、および画像の情報への迅速かつ自動的なアクセスを要求します. このデータを手動で処理し入力することは、ビジネスを遅らせ、エラーを導入し、遵守リスクを増加させる。
現実世界問題
法律、人事、あるいは財務チームは、検索、遵守、またはビジネスワークフローのための何千ものスキャンされた文書や画像を迅速に処理し、インデックスしなければなりません。
ソリューション概要
Aspose.OCR for .NET は、DMS またはワークフロー自動化ソリューションに組み込まれ、新しいファイルを監視し、コンテンツを抽出したり、自動的にビジネスデータベース、API、またはクラウドストレージに認識されたテキストを輸出することができます。
原則
- Visual Studio 2019 以降
- .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET から NuGet
- DMSまたはワークフロー API、データベース、またはクラウドストレージへのアクセス
PM> Install-Package Aspose.OCR
ステップ・ステップ・実施
ステップ1:インストールおよび設定 Aspose.OCR
using Aspose.OCR;
ステップ2:入力ソース(フォルダー、クラウド、またはAPI)を設定する
string inputFolder = "./scans";
foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
{
// Add to processing queue
}
ステップ3:OCR処理の設定
OcrInput input = new OcrInput(InputType.PDF);
input.Add("document.pdf");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
ステップ4:DMS/Workflowにテキストとエクスポートを抽出
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
string text = result.RecognitionText;
// Export: Upload to API, save to DB, send to workflow, etc.
File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
}
ステップ5:バッチの仕事、エラー、および通知を処理する
try
{
// OCR and export code here
}
catch (Exception ex)
{
// Log or notify admin
Console.WriteLine($"Error: {ex.Message}");
}
ステップ6:ビジネスAPIやデータベースと統合する
- ADO.NET、Entity Framework、またはREST API クライアントを使用して輸出します。
- 処理後に通知またはWebhooksを送信する
// Example pseudo-code for REST API upload
// UploadToDmsApi(text, metadata);
ステップ7:セキュリティと遵守のための最適化
- セキュリティデータは、トランジットおよび休憩時に暗号化されます。
- すべてのOCRおよび輸出行動の監査記録を追加する
ステップ8:モニター、スケール、自動化
- 大規模な仕事のための背景サービス、カウンター、またはスケジュールを使用する
- 出力フォルダーと仕事の状態を監視する
// Example: FileSystemWatcher to trigger on new files
// new FileSystemWatcher("./scans")
ステップ9:完全な例(バッチ自動化)
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./scans";
OcrInput input = new OcrInput(InputType.PDF);
foreach (string file in Directory.GetFiles(inputFolder, "*.pdf"))
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
string text = result.RecognitionText;
File.WriteAllText("./output/" + Path.GetFileNameWithoutExtension(result.FileName) + ".txt", text);
// Optionally export to database or API
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
ケースとアプリケーションの使用
自動上陸
自動処理およびあなたのDMSに契約、フォーム、ID文書を保存します。
請求書およびアカウントの有料自動化
請求書データを ERP、AP、またはワークフローエンジンに直接抽出して押します。
遵守と監査の準備
大規模な遵守文書アーカイブおよび報告のための自動 OCR と輸出。
共通の課題と解決策
チャレンジ1:大規模、ブルースティドキュメントロード
**ソリューション:**カウンター、背景労働者、オフタイムの仕事のスケジュールを使用します。
課題2:APIまたはエクスポートエラー
ソリューション: 返信、ログイン、および失敗通知を追加します。
課題3:敏感・機密データ処理
ソリューション: データを暗号化し、アクセスを制限して、すべてのアクションを監査します。
パフォーマンス考慮
- バッチワークはスケーリングを必要とする可能性があります(CPU、I/O)
- システムパフォーマンスと出力コインのモニタリング
- OCR オブジェクトと DB/API 接続を閉じる
ベストプラクティス
- ビジネス要件に対する輸出結果の認証
- 定期的に、すべての依存とセキュリティ設定を更新します。
- ドキュメンタリーおよびすべての自動化ステップの監視
- 別々のテスト/デビューおよび生産環境
高度なシナリオ
シナリオ1:クラウド統合
OCRの結果をクラウドDMS(SharePoint、Google Driveなど)にアップロードします。
シナリオ2:リアルタイムワークフロートリガー
新しいテキストが認識される直後にダウンストリームのワークフローやアラームを刺激します。
結論
Aspose.OCR for .NET は、ビジネスワークフローや DMS プラットフォームとの統合を簡素化し、最小限のコードで情報抽出と文書処理を自動化できます。
高度な自動化およびAPIサンプルについては、 ASPOSE.OCR for .NET API リファレンス .