Як експортувати результати OCR до кількох форматів за допомогою Aspose.OCR
Бізнес, юридичні та відповідні робочі потоки часто вимагають результатів OCR у кількох цифрових форматах для інтеграції, звітування та архівування. Aspose.OCR для .NET забезпечує гнучкий експорт до загальних форматів, таких як TXT, DOCX, XLS X, PDF, і JSON з лише одним методом дзвінка.
Реальні проблеми світу
Дані, витягнуті через ОКР, повинні бути поділені з колегами, імпортуються в ERP або BI інструменти, архівуються або обробляються далі.
Огляд рішення
ASPOSE.OCR дозволяє вибрати формат виходу для кожного результату розпізнавання – будь то прямий текст, форматований Word, таблиці Excel, пошукований PDF або структурований JSON. експорт простий, гнучкий і інтегрується з автоматизованими робочими потоками.
Передумови
- Visual Studio 2019 або вище
- .NET 6.0 або вище (або .Net Framework 4.6.2+)
- ASPOSE.OCR для .NET від NuGet
- Основні навички програмування C#
PM> Install-Package Aspose.OCR
Крок за кроком реалізація
Крок 1: Завантажити та встановити Aspose.OCR
using Aspose.OCR;
Крок 2: Визначте текст, таблиці або зображення
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Крок 3: Експорт результатів OCR до кількох форматів
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
Крок 4: Автоматичний експорт батареї
Експортуйте всі оброблені зображення з папки до бажаних форматів:
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
Крок 5: Управління помилками та валідація експорту
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
Крок 6: Інтеграція з робочим потоком Downstream
Використовуйте експортовані файли в:
- Репортаж та BI dashboards (Excel, JSON)
- Управління документами (PDF, DOCX)
- Автоматичні скрипти (TXT, JSON)
Крок 7: Повний приклад
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
Використання випадків та додатків
ERP / Інтеграція баз даних
Ввезення Excel, JSON або TXT для автоматичного розміщення та пошуку.
Управління документами та архівування
Створіть пошукові, відповідні записи в PDF, DOCX або TXT.
бізнес-репортаж
Популярні BI dashboards або поділитися результатами в кількох форматах.
Спільні виклики та рішення
Виклик 1: Вибір правильного формату для кожного використання
Рішення: Картові виходи до вимог бізнесу та аудиторії.
Виклик 2: Експортні помилки або перепису файлів
Рішення: Додайте перевірки існування файлів та термінових імен.
Проблема 3: Експорт на великі масштаби
Рішення: Автоматизація та графік робочих місць; моніторинг здоров’я експортної папки.
Виконання розглядів
- Експорт великих файлів в кілька форматів може збільшити час обробки
- Моніторинг дискового простору та структури папки
- Регулярно перевіряти експортовані файли
Найкращі практики
- Ім’я експорту для відстеження та пошуку
- Забезпечити і завантажити експортовані файли
- Тест з реальними бізнес-моделями
- Оновлення Aspose.OCR для найновіших експортних функцій
Розширені сценарії
Сценарій 1: Налаштування імен або експортних шляхів
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
Сценарій 2: експортувати тільки конкретні дані (наприклад, таблиці)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
Заключення
ASPOSE.OCR для .NET дозволяє легко передавати результати OCR у форматах, які потрібні вашим робочим потокам, колегам та системам – стимулюючи автоматизацію, обмін та інтеграцію з мінімальним навантаженням.
Подивіться на Aspose.OCR для .NET API Референт для останнього на підтримуваних форматах експорту та передових функціях.