Kā izrakstīt rēķinu datus no daudzvalodīgajām faktūrām
Faktūru automatizācija bieži attiecas uz piegādātājiem vai dokumentiem vairākās valodās, kas rada izaicinājumus lauka ekstrakcijai, kodēšanai un darba plūsmas integrācijai. Aspose.OCR Faktūras teksts .NET nodrošina daudzvalodu faktūras atzīšanu globālajiem uzņēmumiem.
Reālā pasaules problēma
Manuāli pārvaldīt rēķinus vairākās valodās ir laika un kļūdas. automatizēta datu ekstrakcija neveiksmēs, ja OCR nav noklusēts katram mērķtiecīgajam valodam un skriptam.
Risinājumu pārskats
Leverage Aspose.OCR valodas atbalsts, lai iegūtu datus no franču, spāņu, ķīniešu, vācu vai citu rēķinu — ļaujot globālu finanšu automatizāciju un atbilstību.
Prerequisites
- Visual Studio 2019 vai vēlāk
- .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
- Aspose.OCR par .NET no NuGet
- Rēķinu saraksts dažādās valodās
PM> Install-Package Aspose.OCR
Step-by-step īstenošana
1. solis: sagatavo daudzvalodīgu rēķinu komplektu
string[] invoiceFiles = Directory.GetFiles("./invoices_multilingual", "*.pdf");
// Map file to language for each supplier or region
Dictionary<string, Language> invoiceLanguages = new Dictionary<string, Language>
{
{ "invoice1_fr.pdf", Language.French },
{ "invoice2_es.pdf", Language.Spanish },
{ "invoice3_cn.pdf", Language.Chinese },
};
2. solis: Iestatīt un izpildīt atpazīstamību katrai valodai
InvoiceRecognitionSettings settings = new InvoiceRecognitionSettings();
AsposeOcr ocr = new AsposeOcr();
foreach (var kvp in invoiceLanguages)
{
settings.Language = kvp.Value;
OcrInput input = new OcrInput(InputType.PDF);
input.Add(kvp.Key);
var results = ocr.RecognizeInvoice(input, settings);
// Extract and process fields
}
3. solis: Vienkoda/ne angļu valodas lauki droši ekstrakts
- Aizsardzības sistēma atbalsta Unicode
string fullText = results[0].RecognitionText;
// Use field parsing logic as in prior articles
4. solis: Eksportēt rezultātus uz CSV/Excel daudzvalodīgajiem datiem
- Izmantojiet UTF-8 kodēšanu, lai atbalstītu visus rakstzīmes
using (var writer = new StreamWriter("invoice_multilingual.csv", false, Encoding.UTF8))
{
writer.WriteLine("File,Vendor,Date,Total,Language");
// Loop through results and write data
}
5. solis: ierakstiet zemas uzticības/Flag jautājumus pārskatīšanai
- OCR rezultāti var prasīt pārskatu par ne-latīņu skriptiem vai sliktiem skenējumiem
Izmantojiet gadījumus un pieteikumus
Global Finance un ERP automācija
Izrakstīt rēķinu datus no globālajiem piegādātājiem bez manuālās ieejas.
Starptautiskā revīzija un atbilstība
Uzglabāt precīzu ierakstu dažādām jurisdikcijām un ziņošanu.
Daudzvalodu izdevumu analīze
Iespēja ziņot un analizēt dažādās valodās un tirgos.
Kopīgi izaicinājumi un risinājumi
1. izaicinājums: Nezināma vai sajaukta valodas saturs
Rīze: Pre-label failus, vai izmantojiet OCR valodas detekciju kā pirmo pāreju.
2. izaicinājums: kodēšanas vai Unicode kļūdas
Rīze: Vienmēr apstrādā un eksportē ar UTF-8 vai Unicode atbalstu.
3. izaicinājums: valodas specifiskie izkārtojumi
Rīkojums: Izmēģiniet ekstrakcijas loģiku un lauka šķērsli pēc šablonas vai reģiona.
Darbības apsvērumi
- Procedūra pēc valodas par labāko precizitāti
- Validējiet rezultātus katrā valodas sadaļā
Labākās prakses
- Kartes katra rēķina uz savu gaidīto valodu/templātu
- Izmantojiet paraugu komplektus, lai tonētu lauka ekstrakcijas loģiku
- Log kļūdas vai nenoteiktības cilvēka pārskatīšanai
- Drošus starptautiskos datus privātumam
Augstākie scenāriji
1. scenārijs: Integrēt ar daudzvalodu ERP vai darba plūsmu
Eksporta rezultāti formātā / kodēšana tiešai ERP ievadīšanai.
Scenārs 2: Izmanto valodas detekciju dinamiskajai apstrādei
Izmantojiet Aspose.OCR valodas detekciju (ja pieejama), lai automatizētu atpazīšanas cauruļvadu.
Conclusion
Ar Aspose.OCR Invoice to Text for .NET, jūs varat automatizēt rēķinu apstrādi globālajiem piegādātājiem – ekstraktu daudzvalodu datus ar augstu precizitāti un bezjēdzīgu darba plūsmas integrāciju.
See Aspose.OCR par .NET API atsauci atbalstītajām valodām un uzlabotajiem daudzvalodīgajiem kodu paraugiem.