איך להמיר HTML ל-JSON באמצעות C#

איך להמיר HTML ל-JSON באמצעות C#

Μετατρέψτε το HTML σε JSON επιτρέπει στους προγραμματιστές να εξαγάγουν δομημένα δεδομένα από διαδικτυακές μορφές και να τα χρησιμοποιούν σε εφαρμογές που βασίζονται σε δεδομένες. Aspose.Cells για .NET επιτρέπουν στους αναπτυσσόμενους να φορτώνουν τα αρχεία HTML και την εξαγωγή του περιεχομένου τους ως JSON αποτελεσματικά και προγραμματικά.

Γιατί να μετατρέψετε το HTML σε JSON?

  • Δυνατότητα μεταφοράς δεδομένων:- Μεταφορά δεδομένων HTML σε υπηρεσίες backend ή APIs ως JSON.

  • Διαδικτυακή ενσωμάτωση Web-to-App:- Εξαγωγή πίνακα ή δομημένο περιεχόμενο web για περαιτέρω επεξεργασία σε εφαρμογές.

  • Η αυτοματοποίηση είναι έτοιμη:- Ιδανικό για την αυτοματοποίηση διαδικασιών web scraping ή εξόρυξης περιεχομένου.

Βήμα προς βήμα Οδηγός για τη μετατροπή HTML σε JSON

Βήμα 1: Εγκατάσταση Aspose.Cells μέσω NuGet

Εγκαταστήστε Aspose.Cells για .NET:

dotnet add package Aspose.Cells

Βήμα 2: Εισάγετε την άδεια

Επιτρέπει πλήρη λειτουργικότητα:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Βήμα 3: Κατεβάστε το αρχείο HTML

Δημιουργήστε ένα νέο βιβλίο εργασίας φορτώντας την εισαγωγή HTML:

Workbook workbook = new Workbook("Sample.html");

Βήμα 4: Πρόσβαση στο τελευταίο κύτταρο

Προσδιορίστε το τελευταίο κελί στο φύλλο εργασίας για να καθορίσετε τα όρια εξαγωγής:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Βήμα 5: Προσδιορίστε το εύρος εξαγωγής

Δημιουργήστε μια σειρά που εκτείνεται στα δεδομένα φύλλου εργασίας:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Βήμα 6: Ρυθμίστε JsonSaveOptions

Καθορίστε οποιαδήποτε επιλογές εξαγωγής:

JsonSaveOptions options = new JsonSaveOptions();

Βήμα 7: Εξαγωγή στο JSON

Σειράστε το καθορισμένο εύρος στο JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Βήμα 8: Αποθηκεύστε το JSON στο αρχείο

Γράψτε την έκδοση στο δίσκο:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Κοινά ζητήματα και διορθώσεις

1. άδεια έξοδο

  • Λύση: Βεβαιωθείτε ότι το αρχείο HTML περιέχει δομημένο περιεχόμενο με βάση τον πίνακα για την έγκυρη αναγνώριση δεδομένων.

2. αδικαιολόγητη κλίμακα

  • Λύση: Διπλή επαλήθευση ότι το εύρος περιλαμβάνει όλα τα σχετικά κύτταρα από το φύλλο εργασίας.

Εξαγωγική μορφοποίηση

  • Λύση: Χρήση JsonSaveOptions για να ελέγξετε την ενσωμάτωση φύλλων, να ξεφύγετε από τις κενές γραμμές ή να προσαρμόσετε τις υπερσυνδέσεις.
 Ελληνικά