Як експортувати результати OCR до кількох форматів за допомогою Aspose.OCR

Як експортувати результати OCR до кількох форматів за допомогою Aspose.OCR

Бізнес, юридичні та відповідні робочі потоки часто вимагають результатів OCR у кількох цифрових форматах для інтеграції, звітування та архівування. Aspose.OCR для .NET забезпечує гнучкий експорт до загальних форматів, таких як TXT, DOCX, XLS X, PDF, і JSON з лише одним методом дзвінка.

Реальні проблеми світу

Дані, витягнуті через ОКР, повинні бути поділені з колегами, імпортуються в ERP або BI інструменти, архівуються або обробляються далі.

Огляд рішення

ASPOSE.OCR дозволяє вибрати формат виходу для кожного результату розпізнавання – будь то прямий текст, форматований Word, таблиці Excel, пошукований PDF або структурований JSON. експорт простий, гнучкий і інтегрується з автоматизованими робочими потоками.

Передумови

  • Visual Studio 2019 або вище
  • .NET 6.0 або вище (або .Net Framework 4.6.2+)
  • ASPOSE.OCR для .NET від NuGet
  • Основні навички програмування C#
PM> Install-Package Aspose.OCR

Крок за кроком реалізація

Крок 1: Завантажити та встановити Aspose.OCR

using Aspose.OCR;

Крок 2: Визначте текст, таблиці або зображення

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Крок 3: Експорт результатів OCR до кількох форматів

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

Крок 4: Автоматичний експорт батареї

Експортуйте всі оброблені зображення з папки до бажаних форматів:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

Крок 5: Управління помилками та валідація експорту

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

Крок 6: Інтеграція з робочим потоком Downstream

Використовуйте експортовані файли в:

  • Репортаж та BI dashboards (Excel, JSON)
  • Управління документами (PDF, DOCX)
  • Автоматичні скрипти (TXT, JSON)

Крок 7: Повний приклад

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

Використання випадків та додатків

ERP / Інтеграція баз даних

Ввезення Excel, JSON або TXT для автоматичного розміщення та пошуку.

Управління документами та архівування

Створіть пошукові, відповідні записи в PDF, DOCX або TXT.

бізнес-репортаж

Популярні BI dashboards або поділитися результатами в кількох форматах.

Спільні виклики та рішення

Виклик 1: Вибір правильного формату для кожного використання

Рішення: Картові виходи до вимог бізнесу та аудиторії.

Виклик 2: Експортні помилки або перепису файлів

Рішення: Додайте перевірки існування файлів та термінових імен.

Проблема 3: Експорт на великі масштаби

Рішення: Автоматизація та графік робочих місць; моніторинг здоров’я експортної папки.

Виконання розглядів

  • Експорт великих файлів в кілька форматів може збільшити час обробки
  • Моніторинг дискового простору та структури папки
  • Регулярно перевіряти експортовані файли

Найкращі практики

  • Ім’я експорту для відстеження та пошуку
  • Забезпечити і завантажити експортовані файли
  • Тест з реальними бізнес-моделями
  • Оновлення Aspose.OCR для найновіших експортних функцій

Розширені сценарії

Сценарій 1: Налаштування імен або експортних шляхів

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

Сценарій 2: експортувати тільки конкретні дані (наприклад, таблиці)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

Заключення

ASPOSE.OCR для .NET дозволяє легко передавати результати OCR у форматах, які потрібні вашим робочим потокам, колегам та системам – стимулюючи автоматизацію, обмін та інтеграцію з мінімальним навантаженням.

Подивіться на Aspose.OCR для .NET API Референт для останнього на підтримуваних форматах експорту та передових функціях.

 Українська