Com convertir HTML a JSON amb C#

Com convertir HTML a JSON amb C#

La conversió de HTML a JSON permet als desenvolupadors extreure dades estructurades dels formats web i utilitzar-les en aplicacions basades en dades. Aspose.Cells per .NET permet que els programadors carregin arxius HTML i exportin els seus continguts com a jSON de manera eficient i programàtica.

Per què convertir HTML a JSON?

  • Portabilitat de dades:- Transferència de dades tabulars HTML a serveis de backend o APIs com a JSON.

  • Integració web-a-aplicaci:- Extraure taula o contingut web estructurat per a més processament en aplicacions.

  • Automàticament disposat:- Ideal per a l’automatització de processos d’escrapament web o d’extracció de contingut.

Guia de pas a pas per convertir HTML a JSON

Pas 1: Instal·lar Aspose.Cells a través de NuGet

Instal·lació Aspose.Cells per a .NET:

dotnet add package Aspose.Cells

Pas 2: Instal·lació de la llicència

Permet la plena funcionalitat:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Pas 3: Carregar els arxius HTML

Crear un nou llibre de treball carregant la entrada HTML:

Workbook workbook = new Workbook("Sample.html");

Pas 4: Accés a l’última cèl·lula

Identificar l’última cèl·lula a la taula de treball per definir els límits d’exportaci:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Pas 5: Definició de l’àmbit d’exportació

Crea una gamma que emmagatzema les dades de la taula de treball:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Pas 6: Configuració de JsonSaveOptions

Coneix totes les opcions d’exportaci:

JsonSaveOptions options = new JsonSaveOptions();

Pas 7: Exportació a JSON

Serialitzar la gamma definida a JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Pas 8: Salvar JSON al fitxer

Escriu la sortida al disc:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problemes comuns i fixos

1 La sortida buida

  • Solució: Assegureu-vos que el fitxer HTML conté continguts estructurats basats en taules per al reconeixement de dades vàlids.

2 Règim incorrecte

  • Solució: Double-check que la gamma inclou totes les cèl·lules pertinents de la taula de treball.

El format d’exportació

  • Solution: Use JsonSaveOptions to control sheet indexing, skip empty rows, or customize hyperlinks.
 Català