Как экспортировать результаты OCR в несколько форматов с помощью Aspose.OCR
Бизнес, правовые и соответствие рабочие потоки часто требуют результатов OCR в нескольких цифровых форматах для интеграции, отчетности и архивирования. Aspose.OCR для .NET обеспечивает гибкий экспорт в общие форматы, такие как TXT, DOCX, XLS X, PDF и JSON с одним методом звонка.
Реальные мировые проблемы
Данные, полученные через ОКР, должны делиться с коллегами, импортироваться в ERP или BI-инструменты, архивироваться или обрабатываться дальше.
Решение обзор
Aspose.OCR позволяет выбрать формат выхода для каждого результата распознавания — будь то плоский текст, форматированный Word, таблицы Excel, поисковый PDF или структурированная JSON. Экспорт прост, гибкий и интегрируется с автоматизированными рабочими потоками.
Предупреждения
- Visual Studio 2019 или позднее
- .NET 6.0 или более поздний (или .Net Framework 4.6.2+)
- ASPOSE.OCR для .NET от NuGet
- Основные навыки C# программирования
PM> Install-Package Aspose.OCR
Step-by-Step реализация
Шаг 1: Инсталляция и настройка Aspose.OCR
using Aspose.OCR;
Шаг 2: распознайте текст, таблицы или изображения
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Шаг 3: Экспорт результатов ОКР в несколько форматов
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
Шаг 4: Автоматический экспорт батарей
Экспортировать все обрабатываемые изображения из папки в желаемый формат:
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
Шаг 5: Управление ошибками и валидированный экспорт
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
Шаг 6: Интегрируйтесь с потоками работы Downstream
Используйте экспортированные файлы в:
- Репортаж и BI dashboards (Excel, JSON)
- Управление документами (PDF, DOCX)
- Автоматические скрипты (TXT, JSON)
Шаг 7: Полный пример
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
Используйте случаи и приложения
ERP/интеграция базы данных
Импортировать вывод Excel, JSON или TXT для автоматического публикации и поиска.
Управление документами и архивирование
Создайте поисковые, соответствующие записи в PDF, DOCX или TXT.
Бизнес отчеты
Популярные BI dashboards или поделиться результатами в нескольких форматах.
Общие вызовы и решения
Проблема 1: Выбираем правильный формат для каждого использования
Решение: Картовые выходы для бизнес-требований и аудитории.
Проблема 2: Экспортные ошибки или переписывания файлов
Решение: Добавьте проверку существования файлов и фамильные имена.
Проблема 3: экспорт крупномасштабных батарей
Решение: Автоматизировать и планировать работы в комплекте; следить за здоровьем экспортной папки.
Рассмотрим производительность
- Экспорт больших файлов в несколько форматов может увеличить время обработки
- Мониторинг дискового пространства и структуры папки
- Регулярно проверяйте экспортируемые файлы
Лучшие практики
- Название экспорта для отслеживаемости и поиска
- Безопасность и резервное копирование экспортируемых файлов
- Тест с реальными образцами бизнеса
- Обновление Aspose.OCR для последних экспортных функций
Развитые сценарии
Сценарий 1: Название или экспортные пути
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
Сценарий 2: экспортировать только конкретные данные (например, таблицы)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
Заключение
ASPOSE.OCR для .NET облегчает доставку результатов OCR в форматах, которые нужны вашим рабочим потокам, коллегам и системам — стимулируя автоматизацию, обмен и интеграцию с минимальными усилиями.
Смотреть The ASPOSE.OCR для .NET API для последних на поддерживаемых форматах экспорта и передовых функциях.