Hoe HTML naar JSON te converteren met behulp van C#

Hoe HTML naar JSON te converteren met behulp van C#

Het omzetten van HTML naar JSON stelt ontwikkelaars in staat om gestructureerde gegevens uit webformaten te extraheren en te gebruiken in data-driven toepassingen. Aspose.Cells voor .NET stelt ontwikkelaars in staat om HTML-bestanden te laden en hun inhoud als JSON efficiënt en programmatisch te exporteren.

Waarom omzetten HTML naar JSON?

  • Data portabiliteit- Transfer tabulaire HTML-gegevens naar backend-diensten of APIs als JSON.

  • Web-to-app integratie:- Extract tabel of gestructureerd webinhoud voor verdere verwerking in apps.

  • Automatisering voorbereid:- Ideaal voor het automatiseren van web scraping of content extraction processen.

Step-by-step gids voor het omzetten van HTML naar JSON

Stap 1: Installeer Aspose.Cells via NuGet

Installeer Aspose.Cells voor .NET:

dotnet add package Aspose.Cells

Stap 2: Installeer de licentie

Volledige functionaliteit mogelijk maken:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Stap 3: HTML-bestanden opladen

Creëer een nieuw werkboek door de HTML-input te laden:

Workbook workbook = new Workbook("Sample.html");

Stap 4: Toegang tot de laatste cel

Identificeer de laatste cel in het werkblad om exportgrenzen te definiëren:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Stap 5: Definieer de omvang voor export

Creëer een bereik dat de werkbladgegevens verspreidt:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Stap 6: Configure JsonSaveOptions

Bepaal alle uitvoeropties:

JsonSaveOptions options = new JsonSaveOptions();

Stap 7: Export naar JSON

Serialiseren van het gedefinieerde bereik naar JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Stap 8: Save JSON to File

Schrijf de uitgave op de schijf:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Gemeenschappelijke problemen en fixes

1 Leeg uitgang

  • Solutie: Zorg ervoor dat de HTML-bestand tabelgebaseerde gestructureerde inhoud bevat voor geldig gegevensrecognition.

2. onjuiste omvang

  • Solutie: Double-check dat het bereik alle relevante cellen uit het werkblad bevat.

3 De exportformatting

  • Solution: Use JsonSaveOptions to control sheet indexing, skip empty rows, or customize hyperlinks.
 Nederlands