Как извлечь ключевую информацию из счетов с помощью Aspose.OCR

Как извлечь ключевую информацию из счетов с помощью Aspose.OCR

Обработка счетов вручную является медленной, дорогой и причиной ошибок, особенно по масштабу. Aspose.OCR Invoice to Text for .NET позволяет автоматически выводить все ключевые поля счета из сканированных или фотографируемых документов, ускоряя бухгалтерский учет и уменьшая ошибки.

Реальные мировые проблемы

Ручное введение счета замедляет платежные циклы, вводит ошибки и занимает ценное рабочее время. Автоматизация сбора данных имеет решающее значение для современных платежных счетов и финансовой автоматизации.

Решение обзор

ASPOSE.OCR для .NET может распознавать изображения счетов и PDF-файлов, выводить поля, такие как номер счета, дата, поставщик, суммы, и выпускать их в качестве структурированных данных для использования в ERP, базах данных или шифрах.

Предупреждения

  • Visual Studio 2019 или позднее
  • .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
  • ASPOSE.OCR для .NET от NuGet
  • Опыт программирования C#
PM> Install-Package Aspose.OCR

Step-by-Step реализация

Шаг 1: Инсталляция и настройка Aspose.OCR

using Aspose.OCR;

Шаг 2: Подготовка фактурных изображений или PDF-файлов

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// For PDFs:
// OcrInput input = new OcrInput(InputType.PDF);
// input.Add("invoices.pdf");

Шаг 3: Установите настройки распознавания счета

InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
settings.Language = Language.English; // Adjust if needed

Шаг 4: Ввод ключевой фактурной информации

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

Шаг 5: Экспорт или интеграция признанных данных

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
    result.Save("invoice_result.txt", SaveFormat.Text);
    result.Save("invoice_result.json", SaveFormat.Json); // For structured data
}

Шаг 6: Добавить обработку ошибок

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Шаг 7: Оптимизация для рабочих мест Layout и Batch

  • Используйте сканирование высокого разреза или хорошо освещенные фотографии для наилучшей точности.
  • Настройки для языка, расположения или ожидаемых форматов счета
  • Бач обработки всех файлов в каталоге для эффективности
foreach (string file in Directory.GetFiles("./invoices", "*.png"))
{
    input.Add(file);
}

Шаг 8: Полный пример

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice1.png");
            input.Add("invoice2.jpg");

            InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.RecognizeInvoice(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("invoice_result.txt", SaveFormat.Text);
                result.Save("invoice_result.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Используйте случаи и приложения

Счет оплачиваемой автоматизации

Автоматический ввод данных счетов в ERP или бухгалтерские платформы.

Финансовый аудит

Экстракт полей счета для проверки валидации, аудита и соответствия.

Батч цифровизация счета

Конвертируйте большие стаки бумажных или цифровых счетов в структурированные, машинночитаемые форматы.

Общие вызовы и решения

Проблема 1: Ручнописанные или низкокачественные счета

Решение: Используйте лучшее сканирование или корректируйте предварительную обработку для четкости.

Проблема 2: Несовместимые распределения счетов

Решение: Нажмите настройки распознавания для каждого формата и подтверждайте выходы.

Проблема 3: Интеграция данных

Решение: Экспортируйте результаты в качестве JSON для использования в базах данных, дисках или АПИ.

Рассмотрим производительность

  • Процесс батареи для максимальной скорости
  • Использование качественных введений для улучшения распознавания
  • Наличие ОКР-объектов после использования

Лучшие практики

  • Проверка результатов до интеграции с финансовыми системами
  • Сделайте настройки и тестируйте на вашем наборе счетов образца
  • Безопасность и резервное копирование оригинальных фактурных файлов
  • Используйте последнюю версию Aspose.OCR для получения лучших результатов

Развитые сценарии

Сценарий 1: Многоязычная фактура

settings.Language = Language.German;

Сценарий 2: Экспорт результатов в Excel

foreach (RecognitionResult result in results)
{
    result.Save("invoice_result.xlsx", SaveFormat.Xlsx);
}

Заключение

Aspose.OCR Invoice to Text для .NET делает вывод данных счета быстрым, точным и готовым к автоматизации бухгалтерского учета.

Посмотреть более продвинутые образцы использования и API на ASPOSE.OCR для .NET API .

 Русский