Aspose.OCR을 사용하여 여러 형식으로 OCR 결과를 수출하는 방법

Aspose.OCR을 사용하여 여러 형식으로 OCR 결과를 수출하는 방법

비즈니스, 법률 및 준수 작업 흐름은 종종 통합, 보고 및 아카이브를 위해 여러 디지털 형식의 OCR 결과를 필요로합니다. .NET을 위한 Aspose.OCR은 TXT, Docx, XLSX, PDF 및 JSON과 같은 일반적인 형태로 유연한 수출을 제공하며 단 하나의 메서드 호출이 있습니다.

현실 세계 문제

OCR를 통해 추출된 데이터는 동료들과 공유해야 하며, ERP 또는 BI 도구에 가져오거나, 아카이브하거나, 더 많이 처리해야 합니다.

솔루션 검토

Aspose.OCR은 각 인식 결과에 대한 출력 형식을 선택할 수 있습니다 - 깔끔한 텍스트, 포맷 된 Word, Excel 테이블, 검색 가능한 PDF 또는 구조화 된 JSON.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • 기본 C# 프로그래밍 기술
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2: 텍스트, 테이블 또는 이미지를 인식

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

단계 3: OCR 결과를 여러 형식으로 수출

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

단계 4 : 자동 배치 수출

원하는 형식으로 폴더에서 처리 된 모든 이미지를 내보내십시오 :

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

단계 5 : 실수를 처리하고 유효한 수출

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

단계 6 : Downstream Workflows와 통합

수출 된 파일을 사용 하 여:

  • 보고 및 BI 다이어트 (Excel, JSON)
  • 문서 관리 (PDF, DOCX)
  • 자동화 스크립트 (TXT, JSON)

단계 7 : 완전한 예제

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

사례 및 응용 프로그램 사용

ERP / 데이터베이스 통합

자동 게시 및 검색을 위한 Excel, JSON 또는 TXT 출력을 가져옵니다.

문서 관리 및 아카이브

PDF, DOCX 또는 TXT에서 검색할 수 있는, 준수된 레코드를 만드십시오.

비즈니스 보고

인기있는 BI 다이어트 또는 여러 형식으로 결과를 공유합니다.

일반적인 도전과 해결책

도전 1 : 각 사용을위한 올바른 형식을 선택

** 솔루션:** 비즈니스 요구 사항 및 관객에 대한 지도 출력.

도전 2 : 수출 오류 또는 파일 과열

** 솔루션:** 파일 존재 검사 및 시간표 이름을 추가합니다.

도전 3 : 대규모 배치 수출

** 솔루션:** 자동화 및 배치 작업을 일정; 수출 폴더 건강 모니터링.

성과 고려 사항

  • 대형 파일을 여러 형식으로 수출하면 처리 시간을 늘릴 수 있습니다.
  • 디스크 공간 및 폴더 구조 모니터링
  • 정기적으로 수출된 파일을 검증합니다.

모범 사례

  • 추적 및 검색을 위한 이름 수출
  • 보안 및 백업 수출 된 파일
  • 실제 세계 비즈니스 샘플 테스트
  • 최신 수출 기능을 위한 Aspose.OCR 업데이트

고급 시나리오

시나리오 1 : 사용자 지정 또는 수출 경로

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

시나리오 2 : 특정 데이터만 수출 (예 : 테이블)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

결론

Aspose.OCR for .NET은 작업 흐름, 동료 및 시스템이 필요로하는 형식으로 OCR 결과를 쉽게 제공합니다 - 최소한의 노력으로 자동화, 공유 및 통합을 촉진합니다.

보세요 The .NET API 참조를 위한 ASPOSE.OCR 최신 지원된 수출 형식 및 고급 기능에 대 한.

 한국어