Jak przekonwertować HTML na JSON za pomocą C#

Jak przekonwertować HTML na JSON za pomocą C#

Konwersja HTML na JSON pozwala programistom na wydobycie strukturalnych danych z formatów internetowych i użycie ich w aplikacjach opartych na danych. Aspose.Cells dla .NET umożliwia programistom ładowanie plików HTML i efektywne oraz programowe eksportowanie ich zawartości jako JSON.

Dlaczego konwertować HTML na JSON?

  1. Przenośność danych:
    • Przenieś tabelaryczne dane HTML do usług backendowych lub interfejsów API jako JSON.
  2. Integracja Web-to-App:
    • Wydobądź zawartość tabeli lub strukturalną zawartość internetową do dalszego przetwarzania w aplikacjach.
  3. Gotowość do automatyzacji:
    • Idealne do automatyzacji procesów skanowania stron internetowych lub wydobywania treści.

Przewodnik krok po kroku, jak konwertować HTML na JSON

Krok 1: Zainstaluj Aspose.Cells za pomocą NuGet

Zainstaluj Aspose.Cells dla .NET:

dotnet add package Aspose.Cells

Krok 2: Ustaw licencję

Włącz pełną funkcjonalność:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Krok 3: Załaduj plik HTML

Utwórz nowy skoroszyt, ładując dane wejściowe HTML:

Workbook workbook = new Workbook("Sample.html");

Krok 4: Uzyskaj dostęp do ostatniej komórki

Zidentyfikuj ostatnią komórkę w arkuszu, aby zdefiniować granice eksportu:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Krok 5: Zdefiniuj zakres do eksportu

Utwórz zakres, który obejmuje dane arkusza:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Krok 6: Skonfiguruj JsonSaveOptions

Ustaw wszelkie opcje eksportu:

JsonSaveOptions options = new JsonSaveOptions();

Krok 7: Eksportuj do JSON

Serializuj zdefiniowany zakres do JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Krok 8: Zapisz JSON do pliku

Zapisz wynik na dysku:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Częste problemy i ich rozwiązania

1. Pusty wynik

  • Rozwiązanie: Upewnij się, że plik HTML zawiera oparte na tabelach strukturalne treści dla prawidłowego rozpoznawania danych.

2. Nieprawidłowy zakres

  • Rozwiązanie: Sprawdź, czy zakres obejmuje wszystkie istotne komórki z arkusza.

3. Formatowanie eksportu

  • Rozwiązanie: Użyj JsonSaveOptions, aby kontrolować indeksowanie arkuszy, pominąć puste wiersze lub dostosować hiperłącza.
 Polski