Jak przekonwertować HTML na JSON za pomocą C#
Jak przekonwertować HTML na JSON za pomocą C#
Konwersja HTML na JSON pozwala programistom na wydobycie strukturalnych danych z formatów internetowych i użycie ich w aplikacjach opartych na danych. Aspose.Cells dla .NET umożliwia programistom ładowanie plików HTML i efektywne oraz programowe eksportowanie ich zawartości jako JSON.
Dlaczego konwertować HTML na JSON?
- Przenośność danych:
- Przenieś tabelaryczne dane HTML do usług backendowych lub interfejsów API jako JSON.
- Integracja Web-to-App:
- Wydobądź zawartość tabeli lub strukturalną zawartość internetową do dalszego przetwarzania w aplikacjach.
- Gotowość do automatyzacji:
- Idealne do automatyzacji procesów skanowania stron internetowych lub wydobywania treści.
Przewodnik krok po kroku, jak konwertować HTML na JSON
Krok 1: Zainstaluj Aspose.Cells za pomocą NuGet
Zainstaluj Aspose.Cells dla .NET:
dotnet add package Aspose.Cells
Krok 2: Ustaw licencję
Włącz pełną funkcjonalność:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Krok 3: Załaduj plik HTML
Utwórz nowy skoroszyt, ładując dane wejściowe HTML:
Workbook workbook = new Workbook("Sample.html");
Krok 4: Uzyskaj dostęp do ostatniej komórki
Zidentyfikuj ostatnią komórkę w arkuszu, aby zdefiniować granice eksportu:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Krok 5: Zdefiniuj zakres do eksportu
Utwórz zakres, który obejmuje dane arkusza:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Krok 6: Skonfiguruj JsonSaveOptions
Ustaw wszelkie opcje eksportu:
JsonSaveOptions options = new JsonSaveOptions();
Krok 7: Eksportuj do JSON
Serializuj zdefiniowany zakres do JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Krok 8: Zapisz JSON do pliku
Zapisz wynik na dysku:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Częste problemy i ich rozwiązania
1. Pusty wynik
- Rozwiązanie: Upewnij się, że plik HTML zawiera oparte na tabelach strukturalne treści dla prawidłowego rozpoznawania danych.
2. Nieprawidłowy zakres
- Rozwiązanie: Sprawdź, czy zakres obejmuje wszystkie istotne komórki z arkusza.
3. Formatowanie eksportu
- Rozwiązanie: Użyj
JsonSaveOptions
, aby kontrolować indeksowanie arkuszy, pominąć puste wiersze lub dostosować hiperłącza.