Πώς να εξαγάγετε τα φύλλα και τα δεδομένα φύλλου από τις εικόνες με Aspose.OCR
Η εξόρυξη των πίνακων από εικόνες, φόρμες ή σάρωση αναφορών είναι δύσκολη – η χειροκίνητη εκτύπωση είναι αργή και ελαττωματική. Aspose.OCR Table to Text for .NET αυτοματοποιεί την εξαγωγή και διαρθρώσεις των δεδομένων των τραπεζών από τις εικόνας και τις φωτογραφίες.
Το πρόβλημα του πραγματικού κόσμου
Οι οικονομικές καταστάσεις, οι φόρμες έρευνας και τα επιστημονικά αποτελέσματα συχνά παγιδεύονται σε σαρωμένες πίνακες ή εικόνες. Η χειροκίνητη ανακάλυψη αυτών των δεδομένων χάνει ώρες και κινδύνους εισαγωγής σφαλμάτων.
Συνοπτική λύση
Το ASPOSE.OCR για το .NET μπορεί να ανιχνεύει με ακρίβεια, να εξάγει και να μετατρέπει πίνακες από εικόνες ή σάρωση PDF σε μορφές που μπορούν να διαβάσουν οι μηχανές - ιδανικά για Excel, αναφορά ή αυτοματοποίηση ροής εργασίας.
Προϋποθέσεις
- Visual Studio 2019 ή αργότερα
- .NET 6.0 ή μεταγενέστερος (ή .Net Framework 4.6.2+)
- Aspose.OCR για .NET από το NuGet
- Βασικές γνώσεις C#
PM> Install-Package Aspose.OCR
Βήμα προς βήμα εφαρμογή
Βήμα 1: Εγκατάσταση και διαμόρφωση Aspose.OCR
using Aspose.OCR;
Βήμα 2: Σκηνή ή φωτογραφία εικόνων που περιέχουν πίνακες
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
Βήμα 3: Ρυθμίστε τις ρυθμίσεις αναγνώρισης πίνακα
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables
Βήμα 4: Εκτελέστε τη διαδικασία εξόρυξης τραπεζιού
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Βήμα 5: Τα δεδομένα του πίνακα εξαγωγής
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
result.Save("table_data.csv", SaveFormat.Csv); // CSV output
result.Save("table_data.txt", SaveFormat.Text); // Plain text output
}
Βήμα 6: Προσθήκη επεξεργασίας σφαλμάτων και επικύρωσης
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Βήμα 7: Βελτιστοποίηση για σύνθετους, περιστρεφόμενους ή πολλαπλούς πίνακες
- Προεπεξεργασία εικόνων για αποχέτευση ή καλλιέργεια
- Χρησιμοποιήστε σαρώσεις υψηλής ανάλυσης ή φωτογραφίες
- Για πολλά PDFs, προσθέστε κάθε σελίδα ως ξεχωριστή εισαγωγή
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
input.Add(file);
}
Βήμα 8: Συμπληρωματικό παράδειγμα
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx);
result.Save("table_data.csv", SaveFormat.Csv);
result.Save("table_data.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Χρήση περιπτώσεων και εφαρμογών
Χρηματοοικονομική και επιστημονική αναφορά
Αποκτήστε πίνακες από οικονομικές καταστάσεις, αποτελέσματα εργαστηρίου ή ερευνητικά έγγραφα για άμεση ανάλυση στο Excel.
Έρευνα και μορφή επεξεργασίας
Ψηφιοποιήστε τους πίνακες από σαρωμένες φόρμες, checklists ή αρχεία λογοκρισίας.
ΑΥΤΟΜΑΤΙΣΜΟΣ ΕΡΓΑΣΙΑΣ
Εισάγετε δομημένα δεδομένα πίνακα απευθείας στις επιχειρηματικές σας εφαρμογές, εργαλεία BI ή βάσεις δεδομένων.
Κοινές προκλήσεις και λύσεις
Πρόκληση 1: Χαμηλή ποιότητα ή σύνθετα πίνακες
Λύση: Χρησιμοποιήστε εικόνες υψηλής αντοχής και δοκιμάστε τα σύνολα δείγματος.
Δοκιμασία 2: Στρογγυλεμένα ή σκακισμένα τραπέζια
Λύση: Ανακαλύψτε τις εικόνες πριν την επεξεργασία. χρησιμοποιήστε το DetectAreasMode.TABLE.
Δοκιμή 3: Πληροφορίες πολυμέσων
Λύση: Προσθέστε κάθε σελίδα ως ξεχωριστή εισαγωγή για την επεξεργασία συσκευών.
Αξιολόγηση των επιδόσεων
- Batch για ταχύτητα
- Χρησιμοποιήστε υψηλής ποιότητας σαρώσεις / φωτογραφίες
- Διαθεσιμότητα αντικειμένων OCR μετά από μεγάλες διαδρομές
שיטות עבודה מומלצות
- Εγκρίθηκε η παραγωγή πριν από την ολοκλήρωση
- Δοκιμάστε τις ρυθμίσεις αναγνώρισης πίνακα όπως είναι απαραίτητο
- Αποθήκευση πρωτότυπων και ψηφιοποιημένων δεδομένων
- Δοκιμή με πραγματικά δείγματα πριν από την τοποθέτηση
Προχωρημένα σενάρια
Σενάριο 1: Πολυγλωσσική εκχύλιση τραπεζιού
settings.Language = Language.German;
Σενάριο 2: Εξαγωγή στο JSON για τους σωλήνες δεδομένων
foreach (RecognitionResult result in results)
{
result.Save("table_data.json", SaveFormat.Json);
}
Συμπεράσματα
Το ASPOSE.OCR Table to Text για το .NET μετατρέπει τις εικόνες και τις σαρώσεις σε ενεργοποιημένα, δομημένα δεδομένα του πίνακα – έτοιμα για ανάλυση, αναφορά και αυτοματοποίηση.
Δείτε περισσότερα δείγματα κωδικού αναγνώρισης πίνακα στο Aspose.OCR για την αναφορά .NET API .