Aspose.OCRで画像からテーブルデータを抽出する方法

Aspose.OCRで画像からテーブルデータを抽出する方法

Aspose.OCR Table to Text for .NET を使用すると、画像から構造化されたテーブルデータの抽出を自動化することができます - 時間を節約し、エラーを減らし、データベース、Excel、またはレポートツールとの無制限の統合を可能にします。

現実世界問題

企業は頻繁に請求書、レポート、または画像やスキャンなどのフォームでテーブルを受け取ります. 手動でこれらのデータをスプレッドシートや分析プラットフォームに再入力することは、特に大きなボリュームや複雑なタブの場合、不効率でエラーが原因です。

ソリューション概要

Aspose.OCR Table to Text for .NET automates table recognition and data extraction from images, accurately identifying cell structure and content. This allows you to transform scanned or photographed tables into structured, searchable, and editable formats with minimal code. このテーブルは、細胞構造とコンテンツを正確に識別し、画像からタブレットの認識とデータの抽出を自動化します。

原則

始める前に、あなたは必要になります:

  • Visual Studio 2019 以降
  • .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET から NuGet
  • 基本的なC#知識
PM> Install-Package Aspose.OCR

ステップ・ステップ・実施

ステップ1:インストールおよび設定 Aspose.OCR

Aspose.OCR パッケージを追加し、必要な名称スペースを含む:

using Aspose.OCR;

ステップ2:テーブル画像入力の準備

入力に 1 つまたは複数のテーブル画像を追加します. バッチ抽出には、複数ファイルを使用します。

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");

ステップ3:テーブル認識設定を設定する

テーブル検出モードを有効にし、構造が正確に認識されることを保証します。

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text

ステップ4:テーブル認識プロセスを実行する

設定された設定でテーブルを認識する:

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

ステップ5:テーブルデータの輸出と使用

テキスト、Excel、JSON、またはその他のフォーマットに輸出することができます。

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Raw table as text
    result.Save("table.csv", SaveFormat.Csv); // Save as CSV
    result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}

ステップ6:エラー処理を追加する

例外処理を追加して、強力なソリューションを構築します。

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

ステップ7:複雑なテーブルの最適化

  • 高解像度スキャン/写真を使用して正確な構造検出を行います。
  • さまざまなテーブルレイアウトでテスト(混合細胞、マルチラインヘッダー、境界線)
  • 必要に応じて認識設定
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
    input.Add(file);
}

ステップ8:完璧な作業例

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.png");
            input.Add("table2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("table.csv", SaveFormat.Csv);
                result.Save("table.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ケースとアプリケーションの使用

財務報告と請求書

画像からトランザクションテーブルを自動的にExcelまたはデータベースシステムに抽出します。

研究と分析

データ分析のためのスキャンされた出版物や調査フォームからテーブルをデジタル化します。

自動データ移転

遺産文書やスキャンされた紙の記録を現代の構造化されたフォーマットに移行します。

共通の課題と解決策

課題1:ブルーリーまたは複雑なテーブル画像

ソリューション: 構造認識を向上させるために、より明確な画像または事前処理実験を使用します。

チャレンジ2:非標準テーブルランキング

ソリューション: 複雑なレイアウトや無制限テーブルの設定をテストおよび調整します。

チャレンジ3:大型バッチまたは混合画像タイプ

ソリューション: 複数のファイルから抽出を自動化するために、バッチ処理とディレクトリスキャンを使用します。

パフォーマンス考慮

  • よく明るく、高レースの画像を使用する
  • 効率のためのバッチプロセス
  • 使用後のOCRオブジェクトの配置

ベストプラクティス

  • 継続処理前に常に輸出テーブルデータを確認する
  • 最適な構造検出のためのプレプロセス画像
  • セキュア・バックアップ オリジナルのスキャン/画像
  • あなたのワークフローに適切な輸出形式を使用する(CSV、XLSX、JSON)

高度なシナリオ

シナリオ1:混合言語テーブル抽出

settings.Language = Language.Chinese;

シナリオ2:テーブルとテキスト抽出を組み合わせる

settings.DetectAreasMode = DetectAreasMode.COMBINE;

結論

Aspose.OCR Table to Text for .NET は、画像テーブルを構造化された、編集可能なデータに変換します - 手動入力は必要ありません。

詳細やテクニカル情報はこちらをご覧ください。 ASPOSE.OCR for .NET API リファレンス .

 日本語