ASPOSE.OCR を使用して複数のフォーマットに OCR 結果を輸出する方法
ASPOSE.OCR を使用して複数のフォーマットに OCR 結果を輸出する方法
ビジネス、法的、および遵守のワークフローは、統合、報告、アーカイブのための複数のデジタルフォーマットでOCRの結果を必要とすることが多い。
現実世界問題
OCR を通じて抽出されたデータは、同僚と共有され、ERP または BI ツールにインポートされる、アーカイブまたはさらに処理される必要があります。
ソリューション概要
Aspose.OCR では、各認識結果の出力形式を選択することができます - 単純なテキスト、フォーマットされた Word、Excel テーブル、検索可能な PDF、または構造化された JSON. 輸出はシンプルで柔軟で、自動作業流と統合されます。
原則
- Visual Studio 2019 以降
- .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET から NuGet
- C#プログラミングスキル
PM> Install-Package Aspose.OCR
ステップ・ステップ・実施
ステップ1:インストールおよび設定 Aspose.OCR
using Aspose.OCR;
ステップ2:テキスト、テーブル、または画像を認識する
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
ステップ3:OCR結果を複数のフォーマットに輸出する
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
ステップ4:自動バッチ輸出
すべての処理された画像をフォルダーから望ましいフォーマットに輸出する:
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
ステップ5:エラーの処理と有効な輸出
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
ステップ6:ダウンストリームワークフローと統合
輸出されたファイルを使用する:
- レポートとBIダッシュボード(Excel、JSON)
- ドキュメント管理(PDF、DOCX)
- 自動化スクリプト(TXT、JSON)
ステップ7:完璧な例
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
ケースとアプリケーションの使用
ERP/データベース統合
自動投稿と検索のためのExcel、JSON、またはTXT出力を輸入します。
ドキュメント管理とアーカイブ
PDF、DOCX、またはTXTで検索可能で適切なレコードを作成します。
ビジネスレポート
人気 BI ダッシュボードまたは複数のフォーマットで結果を共有します。
共通の課題と解決策
課題1:それぞれの使用に適したフォーマットを選択する
**ソリューション:**ビジネス要件および観客に基づく地図出力。
課題2:エクスポートエラーまたはファイルの過剰書き込み
ソリューション: ファイルの存在チェックと時刻表の名前を追加します。
チャレンジ3:大規模バッチ輸出
ソリューション: バッチワークの自動化とスケジュール; 輸出フォルダーの健康を監視する。
パフォーマンス考慮
- 大型ファイルを複数のフォーマットに輸出すると、処理時間を増やす可能性があります。
- ディスクスペースとフォルダー構造のモニター
- 定期的に輸出されたファイルを確認する
ベストプラクティス
- 検索・追跡のための名称輸出
- セキュアおよびバックアップ 輸出されたファイル
- リアルワールドビジネスサンプルでテスト
- Aspose.OCR を最新の輸出機能にアップデート
高度なシナリオ
シナリオ1:カスタム名称または輸出パス
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
シナリオ2:特定のデータのみを輸出する(例えばテーブル)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
結論
Aspose.OCR for .NET は、作業流、同僚、およびシステムが必要なフォーマットで OCR 結果を提供することを容易にします - 最小限の努力で自動化、共有、統合を促進します。
見る The ASPOSE.OCR for .NET API リファレンス サポートされている輸出フォーマットと高度な機能を最新に提供します。