如何使用 Aspose.OCR 从账单中提取关键信息
如何使用 Aspose.OCR 从账单中提取关键信息
Aspose.OCR Invoice to Text for .NET 允许您从扫描或拍摄文件中自动提取所有关键发票字段,加速会计和减少错误。
现实世界问题
手动发票输入缓慢支付周期,引入错误,并采取有价值的员工时间。 自动数据捕获对现代账户可支付和财务自动化至关重要。
解决方案概述
Aspose.OCR for .NET 可以识别发票图像和 PDF 文件,提取字段,如账单号、日期、供应商、总和,并将其输出为结构化数据用于 ERP、数据库或分布表。
原則
- Visual Studio 2019 或以后
- .NET 6.0 或更高版本(或 .Net Framework 4.6.2+)
- Aspose.OCR 为 .NET 从 NuGet
- 基本的C#编程经验
PM> Install-Package Aspose.OCR
步骤实施
步骤 1: 安装和设置 Aspose.OCR
using Aspose.OCR;
步骤2:准备发票图像或PDF
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// For PDFs:
// OcrInput input = new OcrInput(InputType.PDF);
// input.Add("invoices.pdf");
步骤3:设置发票识别设置
InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English; // Adjust if needed
步骤4:提取关键发票信息
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
步骤5:输出或集成认可数据
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("invoice_result.txt", SaveFormat.Text);
result.Save("invoice_result.json", SaveFormat.Json); // For structured data
}
步骤6:添加错误处理
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
步骤7:优化Layout和Batch工作
- 使用高清扫描或清晰的照片以获得最佳准确性
- 调整语言、布局或预期发票格式的设置
- Batch 在一个目录中处理所有文件以实现效率
foreach (string file in Directory.GetFiles("./invoices", "*.png"))
{
input.Add(file);
}
步骤8:完整的例子
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("invoice_result.txt", SaveFormat.Text);
result.Save("invoice_result.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
使用案例和应用程序
会计可支付自动化
自动输入发票数据到ERP或会计平台。
财务审计
提取证实、审计和遵守检查的账单字段。
Batch 账单数字化
将纸张或数字账单的大堆转换为结构化、机上可读的格式。
共同挑战与解决方案
挑战1:手写或低质量的发票
** 解决方案:** 使用更好的扫描或调整预处理以获得清晰度。
挑战2:不一致的发票布局
** 解决方案:** 为每个格式设置识别设置,并验证输出。
挑战3:数据集成
** 解决方案:** 出口结果为 JSON 用于数据库、分布表或 API。
绩效考虑
- 最大速度的Batch过程
- 使用质量输入以提高认可
- 使用后使用 OCR 物品
最佳实践
- 在融入金融体系之前验证结果
- 点击设置和测试您的样品账单设置
- 安全和备份原始发票文件
- 使用 Aspose.OCR 的最新版本以获得最佳结果
先进的场景
场景1:多语言发票提取
settings.Language = Language.German;
场景2:出口结果到Excel
foreach (RecognitionResult result in results)
{
result.Save("invoice_result.xlsx", SaveFormat.Xlsx);
}
结论
Aspose.OCR Invoice to Text for .NET 使提取账单数据快速、准确、准备好进行会计自动化。
查看更多先进的使用和API样本在 ASPOSE.OCR 为 .NET API 参考 .