Wie man HTML in JSON mit C# konvertiert

Wie man HTML in JSON mit C# konvertiert

Die Umwandlung von HTML in JSON ermöglicht es Entwicklern, strukturierte Daten aus Webformaten zu extrahieren und sie in datengestützten Anwendungen zu verwenden. Aspose.Cells für .NET ermöglicht es Entwicklern, HTML-Dateien zu laden und deren Inhalte effizient und programmgesteuert als JSON zu exportieren.

Warum HTML in JSON umwandeln?

  1. Datenportabilität:
    • Übertragen Sie tabellarische HTML-Daten in Backend-Dienste oder APIs als JSON.
  2. Web-zu-App-Integration:
    • Extrahieren Sie Tabellen- oder strukturierte Webinhalte zur weiteren Verarbeitung in Apps.
  3. Automatisierungsbereit:
    • Ideal zur Automatisierung von Web-Scraping- oder Inhaltsextraktionsprozessen.

Schritt-für-Schritt-Anleitung zur Umwandlung von HTML in JSON

Schritt 1: Aspose.Cells über NuGet installieren

Installieren Sie Aspose.Cells für .NET:

dotnet add package Aspose.Cells

Schritt 2: Lizenz einrichten

Aktivieren Sie die vollständige Funktionalität:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Schritt 3: HTML-Datei laden

Erstellen Sie eine neue Arbeitsmappe, indem Sie die HTML-Eingabe laden:

Workbook workbook = new Workbook("Sample.html");

Schritt 4: Letzte Zelle zugreifen

Identifizieren Sie die letzte Zelle im Arbeitsblatt, um die Exportgrenzen festzulegen:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Schritt 5: Bereich für den Export definieren

Erstellen Sie einen Bereich, der die Daten des Arbeitsblatts umfasst:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Schritt 6: JsonSaveOptions konfigurieren

Legen Sie alle Exportoptionen fest:

JsonSaveOptions options = new JsonSaveOptions();

Schritt 7: In JSON exportieren

Serialisieren Sie den definierten Bereich in JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Schritt 8: JSON in Datei speichern

Schreiben Sie die Ausgabe auf die Festplatte:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Häufige Probleme und Lösungen

1. Leere Ausgabe

  • Lösung: Stellen Sie sicher, dass die HTML-Datei tabellenbasierte strukturierte Inhalte für eine gültige Datenerkennung enthält.

2. Falscher Bereich

  • Lösung: Überprüfen Sie, ob der Bereich alle relevanten Zellen aus dem Arbeitsblatt umfasst.

3. Exportformatierung

  • Lösung: Verwenden Sie JsonSaveOptions, um die Blattindizierung zu steuern, leere Zeilen zu überspringen oder Hyperlinks anzupassen.
 Deutsch