ASPOSE.OCR を使用して複数のフォーマットに OCR 結果を輸出する方法

ASPOSE.OCR を使用して複数のフォーマットに OCR 結果を輸出する方法

ビジネス、法的、および遵守のワークフローは、統合、報告、アーカイブのための複数のデジタルフォーマットでOCRの結果を必要とすることが多い。

現実世界問題

OCR を通じて抽出されたデータは、同僚と共有され、ERP または BI ツールにインポートされる、アーカイブまたはさらに処理される必要があります。

ソリューション概要

Aspose.OCR では、各認識結果の出力形式を選択することができます - 単純なテキスト、フォーマットされた Word、Excel テーブル、検索可能な PDF、または構造化された JSON. 輸出はシンプルで柔軟で、自動作業流と統合されます。

原則

  • Visual Studio 2019 以降
  • .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET から NuGet
  • C#プログラミングスキル
PM> Install-Package Aspose.OCR

ステップ・ステップ・実施

ステップ1:インストールおよび設定 Aspose.OCR

using Aspose.OCR;

ステップ2:テキスト、テーブル、または画像を認識する

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

ステップ3:OCR結果を複数のフォーマットに輸出する

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

ステップ4:自動バッチ輸出

すべての処理された画像をフォルダーから望ましいフォーマットに輸出する:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

ステップ5:エラーの処理と有効な輸出

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

ステップ6:ダウンストリームワークフローと統合

輸出されたファイルを使用する:

  • レポートとBIダッシュボード(Excel、JSON)
  • ドキュメント管理(PDF、DOCX)
  • 自動化スクリプト(TXT、JSON)

ステップ7:完璧な例

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

ケースとアプリケーションの使用

ERP/データベース統合

自動投稿と検索のためのExcel、JSON、またはTXT出力を輸入します。

ドキュメント管理とアーカイブ

PDF、DOCX、またはTXTで検索可能で適切なレコードを作成します。

ビジネスレポート

人気 BI ダッシュボードまたは複数のフォーマットで結果を共有します。

共通の課題と解決策

課題1:それぞれの使用に適したフォーマットを選択する

**ソリューション:**ビジネス要件および観客に基づく地図出力。

課題2:エクスポートエラーまたはファイルの過剰書き込み

ソリューション: ファイルの存在チェックと時刻表の名前を追加します。

チャレンジ3:大規模バッチ輸出

ソリューション: バッチワークの自動化とスケジュール; 輸出フォルダーの健康を監視する。

パフォーマンス考慮

  • 大型ファイルを複数のフォーマットに輸出すると、処理時間を増やす可能性があります。
  • ディスクスペースとフォルダー構造のモニター
  • 定期的に輸出されたファイルを確認する

ベストプラクティス

  • 検索・追跡のための名称輸出
  • セキュアおよびバックアップ 輸出されたファイル
  • リアルワールドビジネスサンプルでテスト
  • Aspose.OCR を最新の輸出機能にアップデート

高度なシナリオ

シナリオ1:カスタム名称または輸出パス

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

シナリオ2:特定のデータのみを輸出する(例えばテーブル)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

結論

Aspose.OCR for .NET は、作業流、同僚、およびシステムが必要なフォーマットで OCR 結果を提供することを容易にします - 最小限の努力で自動化、共有、統合を促進します。

見る The ASPOSE.OCR for .NET API リファレンス サポートされている輸出フォーマットと高度な機能を最新に提供します。

 日本語