Jak przekonwertować HTML na JSON za pomocą C#
Konwersja HTML do JSON Umożliwia programistom wyciąganie strukturowanych danych z formatów internetowych i wykorzystanie ich w aplikacjach opartych na danych. Aspose.Cells for .NET umożliwia rozwojowcom ładowanie plików HTML i eksportowanie ich treści jako JSON w sposób efektywny i programowany.
Dlaczego warto konwertować HTML na JSON?
Portabilność danych:- Przekazywanie tabularnych danych HTML do usług backendowych lub API jako JSON.
Integracja internetowa z aplikacją:- Ekstrakcja tabeli lub strukturowanego treści internetowej w celu dalszego przetwarzania w aplikacjach.
Automatyzacja gotów:- Idealny do automatyzacji procesów skraplenia stron internetowych lub ekstrakcji treści.
Przewodnik krok po kroku do konwersji HTML do JSON
Krok 1: Zainstaluj Aspose.Cells za pośrednictwem NuGet
Instalacja Aspose.Cells dla .NET:
dotnet add package Aspose.Cells
Krok 2: Ustaw licencję
Zapewnienie pełnej funkcjonalności:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Krok 3: Pobierz plik HTML
Tworzenie nowej księgi roboczej poprzez ładowanie wpisu HTML:
Workbook workbook = new Workbook("Sample.html");
Krok 4: Dostęp do ostatniej komórki
Zidentyfikuj ostatnią komórkę w tablicy roboczej, aby określić granice eksportu:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Krok 5: Określenie zakresu eksportu
Stwórz zakres, który rozciąga dane z arkusza roboczego:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Krok 6: Konfiguruj JsonSaveOptions
Wybierz dowolne opcje eksportu:
JsonSaveOptions options = new JsonSaveOptions();
Krok 7: Eksport do JSON
Seriować określony zakres do JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Krok 8: Zapisz JSON do pliku
Wpisz wyjście na dyski:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Wspólne problemy i korekty
1 Puste wyjście
- Rozwiązanie: Upewnij się, że plik HTML zawiera strukturowane treści oparte na tabeli dla ważnego rozpoznawania danych.
2. niewłaściwy zakres
- Rozwiązanie: Podwójne sprawdzenie, że zakres zawiera wszystkie odpowiednie komórki z arkusza roboczego.
Formaty eksportowe
- Rozwiązanie: Użyj
JsonSaveOptions
Aby kontrolować indeksowanie arkuszy, przebić pustych kolejek lub dostosować hiperłącze.