Πώς να εξαγάγετε τα δεδομένα του πίνακα από τις εικόνες με Aspose.OCR

Πώς να εξαγάγετε τα δεδομένα του πίνακα από τις εικόνες με Aspose.OCR

Με το Aspose.OCR Table to Text για .NET, μπορείτε να αυτοματοποιήσετε την εξόρυξη δομημένων στοιχείων του πίνακα από τις εικόνες – εξοικονομήστε χρόνο, μειώστε τα σφάλματα και επιτρέψτε την αδιάλειπτη ολοκλήρωση με τις βάσεις δεδομένων, το Excel ή τα εργαλεία αναφοράς.

Το πρόβλημα του πραγματικού κόσμου

Οι επιχειρήσεις συχνά λαμβάνουν πίνακες σε τιμολόγια, εκθέσεις ή φόρμες όπως εικόνες ή σάρωση. Χειροκίνητα επαναφορά αυτών των δεδομένων σε πλάκες ή αναλυτικά πλατφόρμα είναι αναποτελεσματική και ελαττωματική, ειδικά για μεγάλους όγκους ή πολύπλοκους πίστες.

Συνοπτική λύση

Το ASPOSE.OCR Table to Text για το .NET αυτοματοποιεί την αναγνώριση του πίνακα και την εξόρυξη δεδομένων από τις εικόνες, εντοπίζοντας με ακρίβεια τη δομή και το περιεχόμενο των κυττάρων. Αυτό σας επιτρέπει να μετατρέψετε τις σάρωση ή τις φωτογραφίες σε δομημένες, αναζησιμότητες και επεξεργαστικές μορφές με ελάχιστο κώδικα.

Προϋποθέσεις

Πριν ξεκινήσετε, θα χρειαστείτε:

  • Visual Studio 2019 ή αργότερα
  • .NET 6.0 ή μεταγενέστερος (ή .Net Framework 4.6.2+)
  • Aspose.OCR για .NET από το NuGet
  • Βασικές γνώσεις C#
PM> Install-Package Aspose.OCR

Βήμα προς βήμα εφαρμογή

Βήμα 1: Εγκατάσταση και διαμόρφωση Aspose.OCR

Προσθέστε το πακέτο Aspose.OCR και συμπεριλάβετε τις απαραίτητες ονομαστικές περιοχές:

using Aspose.OCR;

Βήμα 2: Προετοιμάστε τις εισαγωγές εικόνας πίνακα

Προσθέστε μία ή περισσότερες εικόνες του πίνακα στην εισαγωγή σας. Για την εξόρυξη συσκευών, χρησιμοποιήστε πολλαπλά αρχεία.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");

Βήμα 3: Ρυθμίστε τις ρυθμίσεις αναγνώρισης πίνακα

Επιτρέπει τη λειτουργία ανίχνευσης πίνακα για να διασφαλιστεί ότι η δομή αναγνωρίζεται με ακρίβεια.

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text

Βήμα 4: Εκτελέστε τη διαδικασία αναγνώρισης πίνακα

Αναγνωρίστε τους πίνακες με τις ρυθμίσεις:

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Βήμα 5: Εξαγωγή και χρήση δεδομένων πίνακα

Αποθηκεύστε ή επεξεργαστείτε τα αναγνωρισμένα δεδομένα του πίνακα. Μπορείτε να εξάγετε σε κείμενο, Excel, JSON ή άλλες μορφές.

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Raw table as text
    result.Save("table.csv", SaveFormat.Csv); // Save as CSV
    result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}

Βήμα 6: Προσθήκη επεξεργασίας σφαλμάτων

Προσθέστε χειρισμό εξαιρέσεων για να δημιουργήσετε ισχυρές λύσεις.

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Βήμα 7: Βελτιστοποίηση για σύνθετους πίνακες

  • Χρησιμοποιήστε σαρώσεις / φωτογραφίες υψηλής ανάλυσης για ακριβή ανίχνευση δομής
  • Δοκιμή με διάφορες διατάξεις τραπεζιού (συνδυασμένα κύτταρα, πολλαπλές γραμμές κεφαλών, όρια)
  • Εισαγωγή των ρυθμίσεων αναγνώρισης όπως απαιτείται
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
    input.Add(file);
}

Βήμα 8: Συμπληρωματικό παράδειγμα εργασίας

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.png");
            input.Add("table2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("table.csv", SaveFormat.Csv);
                result.Save("table.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Χρήση περιπτώσεων και εφαρμογών

Χρηματοοικονομικές εκθέσεις και τιμολόγια

Εξάγετε αυτόματα τραπέζια συναλλαγών από εικόνες σε συστήματα Excel ή βάσης δεδομένων.

Έρευνα και Ανάλυση

Ψηφιοποιήστε τους πίνακες από σαρωμένες δημοσιεύσεις ή φόρμες έρευνας για ανάλυση δεδομένων.

Αυτοματοποιημένη μετανάστευση δεδομένων

Μεταναστεύετε έγγραφα κληρονομιάς ή σάρωση αρχείων χαρτιού σε σύγχρονες δομημένες μορφές.

Κοινές προκλήσεις και λύσεις

Πρόκληση 1: Blurry ή σύνθετες εικόνες τραπεζιού

Λύση: Χρησιμοποιήστε σαφέστερες εικόνες ή πειράματα με προεπεξεργασία για να βελτιώσετε την αναγνώριση της δομής.

Δοκιμή 2: Μη τυποποιημένη διάταξη τραπεζιού

Λύση: Δοκιμάστε και προσαρμόστε τις ρυθμίσεις για πολύπλοκες διατάξεις ή απεριόριστες πίνακες.

Δοκιμή 3: Μεγάλες μπάτσες ή μικτούς τύπους εικόνας

Λύση: Χρησιμοποιήστε επεξεργασία συσκευών και σάρωση διευθύνσεων για να αυτοματοποιήσετε την εξόρυξη από πολλά αρχεία.

Αξιολόγηση των επιδόσεων

  • Χρησιμοποιήστε καλά φωτισμένες, υψηλές εικόνες
  • Batch για την αποδοτικότητα
  • Διαθέστε αντικείμενα OCR μετά τη χρήση

שיטות עבודה מומלצות

  • Πάντα επικυρώστε τα δεδομένα του πίνακα που εξάγονται πριν από περαιτέρω επεξεργασία
  • Προεπεξεργασία εικόνων για τη βέλτιστη ανίχνευση δομής
  • Εξασφάλιση και αντίγραφο ασφαλείας των αρχικών σάρωσης / εικόνων
  • Χρησιμοποιήστε τη σωστή μορφή εξαγωγής για τη ροή εργασίας σας (CSV, XLSX, JSON)

Προχωρημένα σενάρια

Σενάριο 1: Εξαγωγή μεικτής γλώσσας πίνακα

settings.Language = Language.Chinese;

Σενάριο 2: Συνδυάζοντας πίνακα και εξόρυξη κειμένου

settings.DetectAreasMode = DetectAreasMode.COMBINE;

Συμπεράσματα

Το ASPOSE.OCR Table to Text για το .NET μετατρέπει τους πίνακες εικόνας σε δομημένα, επεξεργαζόμενα δεδομένα – δεν απαιτείται χειροκίνητη εισαγωγή.

Για περισσότερα παραδείγματα και τεχνικές λεπτομέρειες, επισκεφθείτε το Aspose.OCR για την αναφορά .NET API .

 Ελληνικά