Làm thế nào để thu thập thông tin chính từ hóa đơn bằng cách sử dụng Aspose.OCR

Làm thế nào để thu thập thông tin chính từ hóa đơn bằng cách sử dụng Aspose.OCR

Việc xử lý hóa đơn bằng tay là chậm, đắt tiền, và có lỗi - đặc biệt là ở quy mô. Aspose.OCR Invoice to Text for .NET cho phép bạn tự động rút tất cả các lĩnh vực tài khoản chính từ các tài liệu được quét hoặc chụp ảnh, tăng tốc tính toán và giảm các lỗi.

Vấn đề thế giới thực

Nhập hóa đơn thủ công làm chậm chu kỳ thanh toán, giới thiệu sai lầm, và mất thời gian nhân viên có giá trị. Tự động thu thập dữ liệu là quan trọng đối với các tài khoản hiện đại có thể trả tiền và tự động hóa tài chính.

Giải pháp Overview

Aspose.OCR cho .NET có thể nhận ra hình ảnh hóa đơn và PDF, lấy ra các lĩnh vực như số hoá đơn, ngày, nhà cung cấp, tổng, và phát hành chúng như dữ liệu có cấu trúc để sử dụng trong ERP, cơ sở thông tin, hoặc bảng điều khiển.

Nguyên tắc

  • Visual Studio 2019 hoặc hơn
  • .NET 6.0 hoặc mới hơn (hoặc .Net Framework 4.6.2+)
  • Aspose.OCR cho .NET từ NuGet
  • Kinh nghiệm lập trình C#
PM> Install-Package Aspose.OCR

Chế độ thực hiện từng bước

Bước 1: Cài đặt và cấu hình Aspose.OCR

using Aspose.OCR;

Bước 2: Chuẩn bị hình ảnh hóa đơn hoặc PDF

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// For PDFs:
// OcrInput input = new OcrInput(InputType.PDF);
// input.Add("invoices.pdf");

Bước 3: Thiết lập cài đặt nhận dạng hóa đơn

InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English; // Adjust if needed

Bước 4: Tiết xuất thông tin hóa đơn chính

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

Bước 5: xuất hoặc tích hợp dữ liệu nhận dạng

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
    result.Save("invoice_result.txt", SaveFormat.Text);
    result.Save("invoice_result.json", SaveFormat.Json); // For structured data
}

Bước 6: Thêm lỗi xử lý

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Bước 7: Tối ưu hóa cho Layout và Batch Jobs

  • Sử dụng quét độ sáng cao hoặc hình ảnh rõ ràng để có độ chính xác tốt nhất
  • Tùy chỉnh cài đặt cho ngôn ngữ, bố trí, hoặc định dạng hóa đơn dự kiến
  • Batch xử lý tất cả các tập tin trong một thư mục để hiệu quả
foreach (string file in Directory.GetFiles("./invoices", "*.png"))
{
    input.Add(file);
}

Bước 8: Chọn ví dụ đầy đủ

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice1.png");
            input.Add("invoice2.jpg");

            InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("invoice_result.txt", SaveFormat.Text);
                result.Save("invoice_result.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Sử dụng trường hợp và ứng dụng

Tài khoản tự động hóa trả tiền

Tự động nhập dữ liệu hóa đơn vào ERP hoặc nền tảng kế toán.

Tài chính Audit

Chiết xuất các trường hóa đơn cho việc xác nhận, kiểm toán và kiểm tra tuân thủ.

Số hóa đơn Batch

Chuyển đổi các mảnh vỡ lớn của giấy hoặc hóa đơn kỹ thuật số thành định dạng có cấu trúc, có thể đọc bằng máy.

Những thách thức và giải pháp chung

Thách thức 1: Tài khoản bằng tay hoặc chất lượng thấp

** Giải pháp:** Sử dụng quét tốt hơn hoặc điều chỉnh quá trình xử lý trước để có độ rõ ràng.

Lời bài hát: Unconsistent Invoice Layouts

** Giải pháp:** Nhấn cài đặt nhận dạng cho mỗi định dạng, và xác nhận kết quả.

Thách thức 3: Kết hợp dữ liệu

** Giải pháp:** Xuất khẩu kết quả như JSON để sử dụng trong cơ sở dữ liệu, bảng điều khiển, hoặc APIs.

Các tính toán hiệu suất

  • Công trình Batch cho tốc độ tối đa
  • Sử dụng inputs chất lượng để cải thiện nhận thức
  • Thiết bị OCR sau khi sử dụng

Thực hành tốt nhất

  • Chứng nhận kết quả trước khi tích hợp với hệ thống tài chính
  • Đặt cài đặt và kiểm tra trên bộ hóa đơn mẫu của bạn
  • Bảo mật và sao lưu các tập tin hóa đơn ban đầu
  • Sử dụng phiên bản mới nhất của Aspose.OCR cho kết quả tốt nhất

kịch bản tiên tiến

Kịch bản 1: Số hóa đơn đa ngôn ngữ

settings.Language = Language.German;

Kịch bản 2: Export Results to Excel

foreach (RecognitionResult result in results)
{
    result.Save("invoice_result.xlsx", SaveFormat.Xlsx);
}

Kết luận

Aspose.OCR Invoice to Text for .NET làm cho việc rút dữ liệu hóa đơn nhanh chóng, chính xác, và sẵn sàng cho tự động hóa kế toán.

Xem các mẫu sử dụng và API tiên tiến hơn tại Aspose.OCR cho .NET API Reference .

 Tiếng Việt