Как экспортировать результаты OCR в несколько форматов с помощью Aspose.OCR

Как экспортировать результаты OCR в несколько форматов с помощью Aspose.OCR

Бизнес, правовые и соответствие рабочие потоки часто требуют результатов OCR в нескольких цифровых форматах для интеграции, отчетности и архивирования. Aspose.OCR для .NET обеспечивает гибкий экспорт в общие форматы, такие как TXT, DOCX, XLS X, PDF и JSON с одним методом звонка.

Реальные мировые проблемы

Данные, полученные через ОКР, должны делиться с коллегами, импортироваться в ERP или BI-инструменты, архивироваться или обрабатываться дальше.

Решение обзор

Aspose.OCR позволяет выбрать формат выхода для каждого результата распознавания — будь то плоский текст, форматированный Word, таблицы Excel, поисковый PDF или структурированная JSON. Экспорт прост, гибкий и интегрируется с автоматизированными рабочими потоками.

Предупреждения

  • Visual Studio 2019 или позднее
  • .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
  • ASPOSE.OCR для .NET от NuGet
  • Основные навыки C# программирования
PM> Install-Package Aspose.OCR

Step-by-Step реализация

Шаг 1: Инсталляция и настройка Aspose.OCR

using Aspose.OCR;

Шаг 2: распознайте текст, таблицы или изображения

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Шаг 3: Экспорт результатов ОКР в несколько форматов

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

Шаг 4: Автоматический экспорт батарей

Экспортировать все обрабатываемые изображения из папки в желаемый формат:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

Шаг 5: Управление ошибками и валидированный экспорт

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

Шаг 6: Интегрируйтесь с потоками работы Downstream

Используйте экспортированные файлы в:

  • Репортаж и BI dashboards (Excel, JSON)
  • Управление документами (PDF, DOCX)
  • Автоматические скрипты (TXT, JSON)

Шаг 7: Полный пример

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

Используйте случаи и приложения

ERP/интеграция базы данных

Импортировать вывод Excel, JSON или TXT для автоматического публикации и поиска.

Управление документами и архивирование

Создайте поисковые, соответствующие записи в PDF, DOCX или TXT.

Бизнес отчеты

Популярные BI dashboards или поделиться результатами в нескольких форматах.

Общие вызовы и решения

Проблема 1: Выбираем правильный формат для каждого использования

Решение: Картовые выходы для бизнес-требований и аудитории.

Проблема 2: Экспортные ошибки или переписывания файлов

Решение: Добавьте проверку существования файлов и фамильные имена.

Проблема 3: экспорт крупномасштабных батарей

Решение: Автоматизировать и планировать работы в комплекте; следить за здоровьем экспортной папки.

Рассмотрим производительность

  • Экспорт больших файлов в несколько форматов может увеличить время обработки
  • Мониторинг дискового пространства и структуры папки
  • Регулярно проверяйте экспортируемые файлы

Лучшие практики

  • Название экспорта для отслеживаемости и поиска
  • Безопасность и резервное копирование экспортируемых файлов
  • Тест с реальными образцами бизнеса
  • Обновление Aspose.OCR для последних экспортных функций

Развитые сценарии

Сценарий 1: Название или экспортные пути

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

Сценарий 2: экспортировать только конкретные данные (например, таблицы)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

Заключение

ASPOSE.OCR для .NET облегчает доставку результатов OCR в форматах, которые нужны вашим рабочим потокам, коллегам и системам — стимулируя автоматизацию, обмен и интеграцию с минимальными усилиями.

Смотреть The ASPOSE.OCR для .NET API для последних на поддерживаемых форматах экспорта и передовых функциях.

 Русский