如何使用 Aspose.OCR 将 OCR 结果出口到多种格式
如何使用 Aspose.OCR 将 OCR 结果出口到多种格式
商业、法律和遵守工作流往往需要多种数字格式的OCR结果进行集成、报告和存档。
现实世界问题
通过 OCR 提取的数据必须与同事共享,进口到 ERP 或 BI 工具,存档或进一步处理。
解决方案概述
Aspose.OCR 允许您选择每个识别结果的输出格式 - 无论是平板文本、格形Word、Excel 表、可搜索的 PDF 或结构化的 JSON。
原則
- Visual Studio 2019 或以后
- .NET 6.0 或更高版本(或 .Net Framework 4.6.2+)
- Aspose.OCR 为 .NET 从 NuGet
- 基本的C#编程技能
PM> Install-Package Aspose.OCR
步骤实施
步骤 1: 安装和设置 Aspose.OCR
using Aspose.OCR;
步骤2:识别文本、图表或图像
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
步骤3:将 OCR 结果出口到多个格式
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
步骤4:自动包装出口
从一个文件夹出口所有处理的图像到所需格式:
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
步骤5:处理错误和有效出口
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
步骤6:与下流工作流集成
使用导出文件在:
- 报告和 BI 板块(Excel,JSON)
- 文件管理(PDF、DOCX)
- 自动化脚本(TXT、JSON)
步骤7:完整的例子
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
使用案例和应用程序
ERP / 数据库集成
进口 Excel、JSON 或 TXT 输出用于自动发布和搜索。
文件管理与档案
创建可搜索、符合 PDF、DOCX 或 TXT 的记录。
商业报告
受欢迎的 BI 磁盘或共享多个格式的结果。
共同挑战与解决方案
挑战1:选择适当的格式
** 解决方案:** 地图输出,以满足业务需求和观众。
挑战2:出口错误或文件过写
** 解決方案:** 添加檔案存在檢查和時刻表的名稱。
挑战3:大规模包装出口
** 解决方案:** 自动和安排包工作;监测出口文件夹健康。
绩效考虑
- 将大文件出口到多个格式可能会增加处理时间
- 显示磁盘空间和文件夹结构
- 定期验证出口的文件
最佳实践
- 名称出口可追踪和搜索
- 安全和备份出口的文件
- 用现实世界商业样本进行测试
- 更新 Aspose.OCR 最新出口功能
先进的场景
场景1:自定义名称或出口路径
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
场景2:仅出口具体数据(例如表)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
结论
Aspose.OCR for .NET 使您能够轻松地在工作流、同事和系统需要的格式中提供 OCR 结果 - 以最小的努力激发自动化、共享和集成。
看 The ASPOSE.OCR 为 .NET API 参考 最新的支持的出口格式和先进的功能。