Aspose.OCR を使用して請求書から重要な情報を抽出する方法
Aspose.OCR を使用して請求書から重要な情報を抽出する方法
Aspose.OCR Invoice to Text for .NET は、スキャンまたは撮影された文書からすべてのキーフィールドを自動的に抽出し、会計を加速させ、エラーを減らすことを可能にします。
現実世界問題
手動の請求書入力は、支払いサイクルを遅らせ、エラーを導入し、貴重なスタッフ時間を取ります。
ソリューション概要
ASPOSE.OCR for .NET は、請求書の画像や PDF を認識し、会計番号、日付、サプライヤー、合計などのフィールドを抽出して、ERP、データベース、またはスプレッドブックで使用するための構造化されたデータとしてそれらをリリースすることができます。
原則
- Visual Studio 2019 以降
- .NET 6.0 またはそれ以降(または .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET から NuGet
- 基本的なC#プログラミング経験
PM> Install-Package Aspose.OCR
ステップ・ステップ・実施
ステップ1:インストールおよび設定 Aspose.OCR
using Aspose.OCR;
ステップ2:請求書の画像またはPDFを準備する
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// For PDFs:
// OcrInput input = new OcrInput(InputType.PDF);
// input.Add("invoices.pdf");
ステップ3:請求書の認定設定を設定する
InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English; // Adjust if needed
ステップ4:請求書情報の抽出
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
ステップ5:認定データの輸出または統合
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("invoice_result.txt", SaveFormat.Text);
result.Save("invoice_result.json", SaveFormat.Json); // For structured data
}
ステップ6:エラー処理を追加する
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
ステップ7:LayoutとBatch Jobsの最適化
- 最高の正確さのために高解像度スキャンやよく明るい写真を使用します。
- 言語、配置、または予想される請求書形式の設定を調整する
- 効率のためにディレクトリ内のすべてのファイルをバッチ処理
foreach (string file in Directory.GetFiles("./invoices", "*.png"))
{
input.Add(file);
}
ステップ8:完璧な例
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("invoice_result.txt", SaveFormat.Text);
result.Save("invoice_result.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
ケースとアプリケーションの使用
アカウント 支払い自動化
ERPまたは会計プラットフォームへの請求書データの自動入力。
財務監査
認証、監査、および遵守チェックのための請求書フィールドを抽出します。
Batch デジタル化
紙やデジタル請求書の大きなストックを構造化された、機械読みやすいフォーマットに変換します。
共通の課題と解決策
課題1:手書きまたは低品質の請求書
ソリューション: より良いスキャンを使用するか、明確性のために事前処理を調整します。
チャレンジ2:不一致な請求書の配置
**ソリューション:**各フォーマットの認識設定を実行し、出力を有効にします。
課題3:データ統合
ソリューション: データベース、スプレッドシート、または API で使用するために JSON として結果を輸出します。
パフォーマンス考慮
- 最大速度のバッチプロセス
- 品質入力を使用して認識を向上させる
- 使用後のOCRオブジェクトの使用
ベストプラクティス
- 金融システムとの統合前に結果を確認する
- Tune Settings and Test on Your サンプル 請求書セット
- オリジナルの請求書ファイルのセキュリティとバックアップ
- 最高の結果を得るために Aspose.OCR の最新バージョンを使用します。
高度なシナリオ
シナリオ1:多言語請求書抽出
settings.Language = Language.German;
シナリオ2:Excelに結果を輸出する
foreach (RecognitionResult result in results)
{
result.Save("invoice_result.xlsx", SaveFormat.Xlsx);
}
結論
Aspose.OCR Invoice to Text for .NET は、請求書データの抽出が迅速かつ正確で、会計自動化のための準備が整っています。
より高度な使用とAPIサンプルを見る ASPOSE.OCR for .NET API リファレンス .