Cara mengekspor hasil OCR ke format berbilang menggunakan Aspose.OCR

Cara mengekspor hasil OCR ke format berbilang menggunakan Aspose.OCR

Bisnis, hukum, dan aliran kerja pematuhan sering membutuhkan hasil OCR dalam format digital yang berbilang untuk integrasi, laporan dan penyimpanan. Aspose.OCR untuk .NET menyediakan ekspor yang fleksibel ke format umum seperti TXT, DOCX, XLS X, PDF dan JSON dengan hanya satu panggilan metode.

Masalah dunia nyata

Data yang dikeluarkan melalui OCR harus dibagikan dengan rekan kerja, diimport ke ERP atau BI tools, disimpan, atau diproses lebih lanjut.

Penyelesaian Overview

Aspose.OCR memungkinkan Anda memilih format output untuk setiap hasil pengenalan – apakah teks rata, Word yang diformat, tabel Excel, PDF yang dapat dicari, atau JSON yang terstruktur.

Persyaratan

  • Visual Studio 2019 atau lebih baru
  • .NET 6.0 atau lebih baru (atau .Net Framework 4.6.2+)
  • Aspose.OCR untuk .NET dari NuGet
  • Keterampilan Programming C#
PM> Install-Package Aspose.OCR

Implementasi langkah demi langkah

Langkah 1: Menginstal dan mengkonfigurasi Aspose.OCR

using Aspose.OCR;

Langkah 2: Mengidentifikasi teks, tabel, atau gambar

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Langkah 3: Ekspor hasil OCR ke format berbilang

foreach (RecognitionResult result in results)
{
    result.Save("output.txt", SaveFormat.Text);   // Plain text
    result.Save("output.docx", SaveFormat.Docx);  // Microsoft Word
    result.Save("output.xlsx", SaveFormat.Xlsx);  // Excel table
    result.Save("output.pdf", SaveFormat.Pdf);    // Searchable PDF
    result.Save("output.json", SaveFormat.Json);  // Structured JSON
}

Langkah 4: Ekspor Batch otomatis

Ekspor semua gambar yang diproses dari folder ke format yang dikehendaki:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}
// Run OCR, then export as above

Langkah 5: Mengendalikan Kesalahan dan Validate Exports

try
{
    // Export logic
}
catch (Exception ex)
{
    Console.WriteLine($"Export error: {ex.Message}");
}

Langkah 6: Mengintegrasikan dengan Downstream Workflows

Gunakan file yang diekspor di:

  • Laporan dan BI dashboard (Excel, JSON)
  • Pengelolaan Dokumen (PDF, DOCX)
  • Skrip otomatis (TXT dan JSON)

Langkah 7: Contoh lengkap

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("invoice.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output.txt", SaveFormat.Text);
                result.Save("output.docx", SaveFormat.Docx);
                result.Save("output.xlsx", SaveFormat.Xlsx);
                result.Save("output.pdf", SaveFormat.Pdf);
                result.Save("output.json", SaveFormat.Json);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Export error: {ex.Message}");
        }
    }
}

Menggunakan kasus dan aplikasi

Integrasi ERP / Database

Import output Excel, JSON, atau TXT untuk posting dan pencarian otomatis.

Pengelolaan Dokumen dan Arsip

Mencipta rekaman yang dapat dicari, sesuai dalam PDF, DOCX, atau TXT.

Laporan Bisnis

Populasi BI dashboard atau berbagi hasil dalam beberapa format.

Tantangan dan Solusi Umum

Tantangan 1: Memilih format yang tepat untuk setiap penggunaan

** Solusi:** Peta output untuk kebutuhan bisnis dan penonton.

Tantangan 2: Kesalahan Eksport atau File Overwrites

** Solusi:** Tambahkan verifikasi eksistensi file dan nama yang ditandai waktu.

Tantangan 3: Ekspor batch berskala besar

** Solusi:** Automasi dan jadwal pekerjaan batch; memantau kesehatan folder ekspor.

Pertimbangan kinerja

  • Mengekspor file besar ke beberapa format dapat meningkatkan waktu pemrosesan
  • Memantau ruang disk dan struktur folder
  • Mengesahkan file yang diekspor secara teratur

Praktik Terbaik

  • Nama ekspor untuk traceability dan search
  • Mengamankan dan menyimpan file yang diekspor
  • Ujian dengan sampel bisnis dunia nyata
  • Update Aspose.OCR untuk fitur ekspor terbaru

Skenario Lanjutan

Skenario 1: Nama tersuai atau jalur ekspor

string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);

Skenario 2: Mengekspor hanya data spesifik (misalnya tabel)

if (result.HasTable)
    result.Save("output_tables.xlsx", SaveFormat.Xlsx);

Kesimpulan

Aspose.OCR untuk .NET memfasilitasi pengiriman hasil OCR dalam format yang diperlukan oleh aliran kerja, rekan kerja dan sistem Anda – meningkatkan otomatisasi, perkongsian, dan integrasi dengan usaha minimal.

Lihatlah yang Aspose.OCR untuk .NET API Referensi Untuk yang terbaru pada format ekspor yang didukung dan fitur lanjutan.

 Indonesia