Jak exportovat výsledky OCR do více formátů pomocí Aspose.OCR
Obchodní, právní a dodržování pracovních toků často vyžaduje výsledky OCR v několika digitálních formátech pro integraci, hlášení a archivování. Aspose.OCR pro .NET poskytuje flexibilní export do běžných formátů, jako jsou TXT, DOCX, XLS X, PDF a JSON s jediným způsobem volání.
Reálný světový problém
Údaje získané prostřednictvím OCR musí být sdíleny s kolegy, dováženy do ERP nebo BI nástrojů, archivovány nebo zpracovávány dále.
Řešení přehled
Aspose.OCR vám umožňuje vybrat formát výstupu pro každý výsledek rozpoznání – ať už je to plochý text, formatovaný Word, Excel tabulky, vyhledatelný PDF nebo strukturovaný JSON. Vývoz je jednoduchý, flexibilní a integruje se s automatizovanými pracovními toky.
Předpoklady
- Visual Studio 2019 nebo novější
- .NET 6.0 nebo novější (nebo .Net Framework 4.6.2+)
- Aspose.OCR pro .NET z NuGet
- Základní C# programovací dovednosti
PM> Install-Package Aspose.OCR
krok za krokem implementace
Krok 1: Instalace a nastavení ASPOSE.OCR
using Aspose.OCR;
Krok 2: Rozpoznání textu, tabulek nebo obrázků
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Krok 3: Vývoz výsledků OCR do více formátů
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text); // Plain text
result.Save("output.docx", SaveFormat.Docx); // Microsoft Word
result.Save("output.xlsx", SaveFormat.Xlsx); // Excel table
result.Save("output.pdf", SaveFormat.Pdf); // Searchable PDF
result.Save("output.json", SaveFormat.Json); // Structured JSON
}
Krok 4: Automatický vývoz batchů
Exportujte všechny zpracované obrázky z složky do požadovaných formátů:
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
// Run OCR, then export as above
Krok 5: Řešení chyb a validace vývozu
try
{
// Export logic
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
Krok 6: Integrace s Downstream Workflows
Použijte exportované soubory v:
- Reporting a BI dashboards (Excel, JSON)
- Řízení dokumentů (PDF, DOCX)
- Automatizační skripty (TXT, JSON)
Krok 7: Kompletní příklad
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("invoice.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output.txt", SaveFormat.Text);
result.Save("output.docx", SaveFormat.Docx);
result.Save("output.xlsx", SaveFormat.Xlsx);
result.Save("output.pdf", SaveFormat.Pdf);
result.Save("output.json", SaveFormat.Json);
}
}
catch (Exception ex)
{
Console.WriteLine($"Export error: {ex.Message}");
}
}
}
Použití případů a aplikací
ERP / integrace databáze
Import Excel, JSON nebo TXT výstup pro automatické zveřejnění a vyhledávání.
Správa dokumentů a archivace
Vytvořte vyhledatelné, shodné záznamy v PDF, DOCX nebo TXT.
Podnikatelská zpráva
Populární BI dashboards nebo sdílet výsledky v několika formátech.
Společné výzvy a řešení
Výzva 1: Výběr správného formátu pro každou aplikaci
Rozhodnutí: Mapové výstupy pro obchodní požadavky a publikum.
Výzva 2: Exportní chyby nebo přepisy souborů
Rozhodnutí: Přidejte kontroly existence souborů a časově označené názvy.
Výzva 3: Velká škála vývozu batchů
Rozhodnutí: Automatizujte a naplánujte batchové práce; monitorujte zdraví exportních složek.
Úvahy o výkonu
- Export velkých souborů do více formátů může zvýšit čas zpracování
- Monitor diskového prostoru a složkové struktury
- Pravidelně ověřujte exportované soubory
Nejlepší postupy
- Název vývozu pro sledovatelnost a vyhledávání
- Zabezpečení a zálohování exportovaných souborů
- Testování reálných obchodních vzorků
- Aktualizace Aspose.OCR pro nejnovější funkce vývozu
Pokročilé scénáře
Scénář 1: Přizpůsobené jmenování nebo vývozní cesty
string customName = Path.GetFileNameWithoutExtension(result.FileName) + "_ocr";
result.Save($"./exports/{customName}.pdf", SaveFormat.Pdf);
Scénář 2: Export pouze specifických údajů (např. tabulky)
if (result.HasTable)
result.Save("output_tables.xlsx", SaveFormat.Xlsx);
závěr
Aspose.OCR pro .NET usnadňuje doručování výsledků OCR ve formátech, které vaše pracovní toky, kolegy a systémy potřebují – zvyšuje automatizaci, sdílení a integraci s minimálním úsilím.
Podívejte se Aspose.OCR pro .NET API Reference pro nejnovější na podporovaných exportních formátech a pokročilých funkcích.