Come convertire HTML in JSON utilizzando C#

Come convertire HTML in JSON utilizzando C#

Convertire HTML in JSON consente agli sviluppatori di estrarre dati strutturati dai formati web e utilizzarli in applicazioni basate sui dati. Aspose.Cells per .NET consente agli sviluppatori di caricare file HTML ed esportare i loro contenuti come JSON in modo efficiente e programmatico.

Perché convertire HTML in JSON?

  1. Portabilità dei Dati:
    • Trasferire dati tabulari HTML nei servizi backend o API come JSON.
  2. Integrazione Web-App:
    • Estrarre contenuti web tabulari o strutturati per ulteriori elaborazioni nelle app.
  3. Pronto per l’Automazione:
    • Ideale per automatizzare i processi di web scraping o estrazione di contenuti.

Guida Passo-Passo per Convertire HTML in JSON

Passo 1: Installare Aspose.Cells tramite NuGet

Installare Aspose.Cells per .NET:

dotnet add package Aspose.Cells

Passo 2: Impostare la Licenza

Abilitare la funzionalità completa:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Passo 3: Caricare il File HTML

Creare un nuovo workbook caricando l’input HTML:

Workbook workbook = new Workbook("Sample.html");

Passo 4: Accedere all’Ultima Cella

Identificare l’ultima cella nel foglio di lavoro per definire i confini di esportazione:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Passo 5: Definire l’Intervallo per l’Esportazione

Creare un intervallo che copre i dati del foglio di lavoro:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Passo 6: Configurare JsonSaveOptions

Impostare eventuali opzioni di esportazione:

JsonSaveOptions options = new JsonSaveOptions();

Passo 7: Esportare in JSON

Serializzare l’intervallo definito in JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Passo 8: Salvare JSON nel File

Scrivere l’output su disco:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problemi Comuni e Soluzioni

1. Output Vuoto

  • Soluzione: Assicurarsi che il file HTML contenga contenuti strutturati basati su tabelle per un riconoscimento valido dei dati.

2. Intervallo Errato

  • Soluzione: Controllare che l’intervallo includa tutte le celle rilevanti dal foglio di lavoro.

3. Formattazione dell’Esportazione

  • Soluzione: Utilizzare JsonSaveOptions per controllare l’indicizzazione del foglio, saltare righe vuote o personalizzare i collegamenti ipertestuali.
 Italiano