Comment convertir HTML en JSON en utilisant C#

Comment convertir HTML en JSON en utilisant C#

La conversion de HTML en JSON permet aux développeurs d’extraire des données structurées à partir de formats web et de les utiliser dans des applications basées sur des données. Aspose.Cells pour .NET permet aux développeurs de charger des fichiers HTML et d’exporter leur contenu en JSON de manière efficace et programmatique.

Pourquoi convertir HTML en JSON ?

  1. Portabilité des données :
    • Transférer des données HTML tabulaires vers des services backend ou des API sous forme de JSON.
  2. Intégration Web-App :
    • Extraire du contenu web structuré ou des tableaux pour un traitement ultérieur dans des applications.
  3. Prêt à l’automatisation :
    • Idéal pour automatiser des processus de scraping web ou d’extraction de contenu.

Guide étape par étape pour convertir HTML en JSON

Étape 1 : Installer Aspose.Cells via NuGet

Installer Aspose.Cells pour .NET :

dotnet add package Aspose.Cells

Étape 2 : Configurer la licence

Activer toutes les fonctionnalités :

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Étape 3 : Charger le fichier HTML

Créer un nouveau classeur en chargeant l’entrée HTML :

Workbook workbook = new Workbook("Sample.html");

Étape 4 : Accéder à la dernière cellule

Identifier la dernière cellule dans la feuille de calcul pour définir les limites d’exportation :

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Étape 5 : Définir la plage pour l’exportation

Créer une plage qui couvre les données de la feuille de calcul :

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Étape 6 : Configurer JsonSaveOptions

Définir les options d’exportation :

JsonSaveOptions options = new JsonSaveOptions();

Étape 7 : Exporter vers JSON

Sérialiser la plage définie en JSON :

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Étape 8 : Sauvegarder le JSON dans un fichier

Écrire la sortie sur le disque :

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problèmes courants et solutions

1. Sortie vide

  • Solution : Assurez-vous que le fichier HTML contient un contenu structuré basé sur des tableaux pour une reconnaissance valide des données.

2. Plage incorrecte

  • Solution : Vérifiez que la plage inclut toutes les cellules pertinentes de la feuille de calcul.

3. Formatage de l’exportation

  • Solution : Utilisez JsonSaveOptions pour contrôler l’indexation des feuilles, ignorer les lignes vides ou personnaliser les hyperliens.
 Français