如何使用 Aspose.OCR 从账单中提取关键信息

如何使用 Aspose.OCR 从账单中提取关键信息

Aspose.OCR Invoice to Text for .NET 允许您从扫描或拍摄文件中自动提取所有关键发票字段,加速会计和减少错误。

现实世界问题

手动发票输入缓慢支付周期,引入错误,并采取有价值的员工时间。 自动数据捕获对现代账户可支付和财务自动化至关重要。

解决方案概述

Aspose.OCR for .NET 可以识别发票图像和 PDF 文件,提取字段,如账单号、日期、供应商、总和,并将其输出为结构化数据用于 ERP、数据库或分布表。

原則

  • Visual Studio 2019 或以后
  • .NET 6.0 或更高版本(或 .Net Framework 4.6.2+)
  • Aspose.OCR 为 .NET 从 NuGet
  • 基本的C#编程经验
PM> Install-Package Aspose.OCR

步骤实施

步骤 1: 安装和设置 Aspose.OCR

using Aspose.OCR;

步骤2:准备发票图像或PDF

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// For PDFs:
// OcrInput input = new OcrInput(InputType.PDF);
// input.Add("invoices.pdf");

步骤3:设置发票识别设置

InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English; // Adjust if needed

步骤4:提取关键发票信息

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

步骤5:输出或集成认可数据

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
    result.Save("invoice_result.txt", SaveFormat.Text);
    result.Save("invoice_result.json", SaveFormat.Json); // For structured data
}

步骤6:添加错误处理

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

步骤7:优化Layout和Batch工作

  • 使用高清扫描或清晰的照片以获得最佳准确性
  • 调整语言、布局或预期发票格式的设置
  • Batch 在一个目录中处理所有文件以实现效率
foreach (string file in Directory.GetFiles("./invoices", "*.png"))
{
    input.Add(file);
}

步骤8:完整的例子

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice1.png");
            input.Add("invoice2.jpg");

            InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("invoice_result.txt", SaveFormat.Text);
                result.Save("invoice_result.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

使用案例和应用程序

会计可支付自动化

自动输入发票数据到ERP或会计平台。

财务审计

提取证实、审计和遵守检查的账单字段。

Batch 账单数字化

将纸张或数字账单的大堆转换为结构化、机上可读的格式。

共同挑战与解决方案

挑战1:手写或低质量的发票

** 解决方案:** 使用更好的扫描或调整预处理以获得清晰度。

挑战2:不一致的发票布局

** 解决方案:** 为每个格式设置识别设置,并验证输出。

挑战3:数据集成

** 解决方案:** 出口结果为 JSON 用于数据库、分布表或 API。

绩效考虑

  • 最大速度的Batch过程
  • 使用质量输入以提高认可
  • 使用后使用 OCR 物品

最佳实践

  • 在融入金融体系之前验证结果
  • 点击设置和测试您的样品账单设置
  • 安全和备份原始发票文件
  • 使用 Aspose.OCR 的最新版本以获得最佳结果

先进的场景

场景1:多语言发票提取

settings.Language = Language.German;

场景2:出口结果到Excel

foreach (RecognitionResult result in results)
{
    result.Save("invoice_result.xlsx", SaveFormat.Xlsx);
}

结论

Aspose.OCR Invoice to Text for .NET 使提取账单数据快速、准确、准备好进行会计自动化。

查看更多先进的使用和API样本在 ASPOSE.OCR 为 .NET API 参考 .

 中文