Ako premeniť HTML na JSON pomocou C#

Ako premeniť HTML na JSON pomocou C#

Konverzia HTML na JSON umožňuje vývojárom extrahovať štruktúrované údaje z webových formátov a používať ich v aplikáciách na báze údajov. Aspose.Cells for .NET umožňuje vývojárom nahrať HTML súbory a exportovať ich obsah ako JSON efektívne a programovateľne.

Prečo premeniť HTML na JSON?

  • Portabilita údajov:- Prenos tabuľkových HTML údajov do backend služieb alebo API ako JSON.

  • Integrovanie webových stránok do aplikácií:- Extrakt tabuľky alebo štruktúrovaný webový obsah pre ďalšie spracovanie v aplikáciách.

  • Automatizácia je pripravená:- Ideálne pre automatizáciu web scrapingu alebo procesov extrakcie obsahu.

Krok za krokom sprievodca premenou HTML na JSON

Krok 1: Inštalácia Aspose.Cells prostredníctvom NuGet

Inštalácia Aspose.Cells pre .NET:

dotnet add package Aspose.Cells

Krok 2: Nastavenie licencie

Umožňuje plnú funkčnosť:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Krok 3: Nahrať HTML súbory

Vytvorte novú pracovnú knihu nahrávaním vstupu HTML:

Workbook workbook = new Workbook("Sample.html");

Krok 4: Prístup k poslednej bunke

Identifikujte poslednú bunku v pracovnej doske, aby ste definovali vývozné hranice:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Krok 5: Zadajte rozsah vývozu

Vytvorte rozsah, ktorý rozširuje údaje o pracovnej doske:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Krok 6: Nastavenie JsonSaveOptions

Zadajte všetky možnosti vývozu:

JsonSaveOptions options = new JsonSaveOptions();

Krok 7: Export na JSON

Serializujte definovaný rozsah na JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Krok 8: Uložiť JSON do súboru

Napíšte výstup na disk:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Spoločné problémy a riešenia

1. prázdny výstup

  • Riešenie: Uistite sa, že súbor HTML obsahuje tabuľkový štruktúrovaný obsah pre platné rozpoznávanie údajov.

2. nesprávny rozsah

  • Riešenie: Dvojnásobne skontrolujte, že rozsah obsahuje všetky relevantné bunky z pracovnej dosky.

Formátovanie vývozu

  • Solution: Use JsonSaveOptions to control sheet indexing, skip empty rows, or customize hyperlinks.
 Slovenčina