Comment convertir HTML en JSON en utilisant C#
Comment convertir HTML en JSON en utilisant C#
La conversion de HTML en JSON permet aux développeurs d’extraire des données structurées à partir de formats web et de les utiliser dans des applications basées sur des données. Aspose.Cells pour .NET permet aux développeurs de charger des fichiers HTML et d’exporter leur contenu en JSON de manière efficace et programmatique.
Pourquoi convertir HTML en JSON ?
- Portabilité des données :
- Transférer des données HTML tabulaires vers des services backend ou des API sous forme de JSON.
- Intégration Web-App :
- Extraire du contenu web structuré ou des tableaux pour un traitement ultérieur dans des applications.
- Prêt à l’automatisation :
- Idéal pour automatiser des processus de scraping web ou d’extraction de contenu.
Guide étape par étape pour convertir HTML en JSON
Étape 1 : Installer Aspose.Cells via NuGet
Installer Aspose.Cells pour .NET :
dotnet add package Aspose.Cells
Étape 2 : Configurer la licence
Activer toutes les fonctionnalités :
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Étape 3 : Charger le fichier HTML
Créer un nouveau classeur en chargeant l’entrée HTML :
Workbook workbook = new Workbook("Sample.html");
Étape 4 : Accéder à la dernière cellule
Identifier la dernière cellule dans la feuille de calcul pour définir les limites d’exportation :
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Étape 5 : Définir la plage pour l’exportation
Créer une plage qui couvre les données de la feuille de calcul :
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Étape 6 : Configurer JsonSaveOptions
Définir les options d’exportation :
JsonSaveOptions options = new JsonSaveOptions();
Étape 7 : Exporter vers JSON
Sérialiser la plage définie en JSON :
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Étape 8 : Sauvegarder le JSON dans un fichier
Écrire la sortie sur le disque :
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Problèmes courants et solutions
1. Sortie vide
- Solution : Assurez-vous que le fichier HTML contient un contenu structuré basé sur des tableaux pour une reconnaissance valide des données.
2. Plage incorrecte
- Solution : Vérifiez que la plage inclut toutes les cellules pertinentes de la feuille de calcul.
3. Formatage de l’exportation
- Solution : Utilisez
JsonSaveOptions
pour contrôler l’indexation des feuilles, ignorer les lignes vides ou personnaliser les hyperliens.