Wie man HTML in JSON mit C# konvertiert#

Wie man HTML in JSON mit C# konvertiert#

Umwandeln von HTML in JSON ermöglicht es Entwicklern, strukturierte Daten aus Web-Formaten zu extrahieren und sie in Datendriven-Anwendungen zu verwenden. Aspose.Cells für .NET erlaubt Entwicklern, HTML-Dateien zu laden und ihre Inhalte als JSON effizient und programmatisch zu exportieren.

Warum HTML in JSON umwandeln?

  • Datenübertragbarkeit:- bertragen Tabular HTML-Daten in Backend-Dienstleistungen oder APIs als JSON.

  • Web-to-App-Integration und -Integration:- Extrahieren Sie Tabelle oder strukturierte Web-Inhalte für weitere Verarbeitung in Apps.

  • Automatisierung bereit:- Ideal für die automatisierung von web scraping oder content extraction processen.

Schritt für Schritt Guide zum Umwandeln von HTML in JSON

Schritt 1: Installieren Sie Aspose.Cells über NuGet

Installieren Aspose.Cells für .NET:

dotnet add package Aspose.Cells

Schritt 2: Installieren Sie die Lizenz

Erlaubt die volle Funktionalität:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Schritt 3: Laden Sie HTML-Dateien

Erstellen Sie ein neues Arbeitsbuch, indem Sie den HTML-Eintrag laden:

Workbook workbook = new Workbook("Sample.html");

Schritt 4: Zugang zur letzten Zelle

Identifizieren Sie die letzte Zelle im Arbeitsblatt, um die Ausfuhrgrenzen zu definieren:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Schritt 5: Bestimmen Sie den Ausfuhrbereich

Erstellen Sie eine Reihe, die die Arbeitsblattdaten abdeckt:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Schritt 6: Konfigurieren Sie JsonSaveOptions

Besuchen Sie alle Exportoptionen:

JsonSaveOptions options = new JsonSaveOptions();

Schritt 7: Export zu JSON

Serialisieren Sie das definierte Range auf JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Schritt 8: Speichern Sie JSON in Datei

Schreiben Sie die Ausgabe auf den Disk:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Gemeinsame Probleme und Fixes

1. Leere Ausgang

  • Lösung: Stellen Sie sicher, dass die HTML-Datei Tabellenbasierte strukturierte Inhalte für gültige Datenerkennung enthält.

2. Unregelmäßige Reichweite

  • Lösung: Double-check, dass das Bereich alle relevanten Zellen aus dem Arbeitsblatt enthält.

3. Exportformatisierung

  • Lösung - Benutzung JsonSaveOptions um die Indexierung von Blättern zu kontrollieren, leere Zeilen zu überspringen oder Hyperlinks anzupassen.
 Deutsch