如何使用 Aspose.OCR 将 OCR 结果出口到多种格式

如何使用 Aspose.OCR 将 OCR 结果出口到多种格式

商业、法律和遵守工作流往往需要多种数字格式的OCR结果进行集成、报告和存档。

现实世界问题

通过 OCR 提取的数据必须与同事共享,进口到 ERP 或 BI 工具,存档或进一步处理。

解决方案概述

Aspose.OCR 允许您选择每个识别结果的输出格式 - 无论是平板文本、格形Word、Excel 表、可搜索的 PDF 或结构化的 JSON。

原則

  • Visual Studio 2019 或以后
  • .NET 6.0 或更高版本(或 .Net Framework 4.6.2+)
  • Aspose.OCR 为 .NET 从 NuGet
  • 基本的C#编程技能
PM> Install-Package Aspose.OCR

步骤实施

步骤 1: 安装和设置 Aspose.OCR

using Aspose.OCR;

步骤2:识别文本、图表或图像

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

步骤3:将 OCR 结果出口到多个格式

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

步骤4:自动包装出口

从一个文件夹出口所有处理的图像到所需格式:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

步骤5:处理错误和有效出口

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

步骤6:与下流工作流集成

使用导出文件在:

  • 报告和 BI 板块(Excel,JSON)
  • 文件管理(PDF、DOCX)
  • 自动化脚本(TXT、JSON)

步骤7:完整的例子

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

使用案例和应用程序

ERP / 数据库集成

进口 Excel、JSON 或 TXT 输出用于自动发布和搜索。

文件管理与档案

创建可搜索、符合 PDF、DOCX 或 TXT 的记录。

商业报告

受欢迎的 BI 磁盘或共享多个格式的结果。

共同挑战与解决方案

挑战1:选择适当的格式

** 解决方案:** 地图输出,以满足业务需求和观众。

挑战2:出口错误或文件过写

** 解決方案:** 添加檔案存在檢查和時刻表的名稱。

挑战3:大规模包装出口

** 解决方案:** 自动和安排包工作;监测出口文件夹健康。

绩效考虑

  • 将大文件出口到多个格式可能会增加处理时间
  • 显示磁盘空间和文件夹结构
  • 定期验证出口的文件

最佳实践

  • 名称出口可追踪和搜索
  • 安全和备份出口的文件
  • 用现实世界商业样本进行测试
  • 更新 Aspose.OCR 最新出口功能

先进的场景

场景1:自定义名称或出口路径

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

场景2:仅出口具体数据(例如表)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

结论

Aspose.OCR for .NET 使您能够轻松地在工作流、同事和系统需要的格式中提供 OCR 结果 - 以最小的努力激发自动化、共享和集成。

看 The ASPOSE.OCR 为 .NET API 参考 最新的支持的出口格式和先进的功能。

 中文