Jak převést HTML na JSON pomocí C#

Jak převést HTML na JSON pomocí C#

Přeměna HTML na JSON Umožňuje vývojářům extrahovat strukturované údaje z webových formátů a používat je v aplikacích řízených daty. Aspose.Cells pro .NET umožňuje vývojáři načítat HTML soubory a exportovat jejich obsah jako JSON efektivně a programovaně.

Proč přeměnit HTML na JSON?

  • Přenositelnost údaj:- Přenos tabulárních HTML dat do backendových služeb nebo API jako JSON.

  • Integrace web-to-app:- Extrahujte tabulku nebo strukturovaný webový obsah pro další zpracování v aplikacích.

  • Automatizace připraven:- Ideální pro automatizaci procesů web scrapingu nebo extrakce obsahu.

Krok za krokem průvodce pro konverzi HTML do JSON

Krok 1: Instalace Aspose.Cells prostřednictvím NuGet

Instalace Aspose.Cells pro .NET:

dotnet add package Aspose.Cells

Krok 2: Nastavení licence

Nabízí plnou funkčnost:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Krok 3: Stáhnout HTML soubor

Vytvořte si novou pracovní knihu nahrazením vstupu HTML:

Workbook workbook = new Workbook("Sample.html");

Krok 4: Přístup k poslední buňce

Identifikovat poslední buňku v tabulce definovat vývozní hranice:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Krok 5: Definujte rozsah vývozu

Vytvořte rozsah, který rozšiřuje data pracovního listu:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Krok 6: Nastavení JsonSaveOptions

Nastavení jakýchkoli možností vývozu:

JsonSaveOptions options = new JsonSaveOptions();

Krok 7: Export na JSON

Serializujte definovaný rozsah na JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Krok 8: Uložte JSON do souboru

Napíšte výstup na disk:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Společné problémy a fixy

1. prázdný výstup

  • Rozhodnutí: Ujistěte se, že soubor HTML obsahuje strukturovaný obsah založený na tabulce pro platné rozpoznávání dat.

2. nesprávný rozsah

  • Rozhodnutí: Dvojnásobně zkontrolujte, že rozsah zahrnuje všechny relevantní buňky z pracovního listu.

3. formátování vývozu

  • Rozhodnutí: Použití JsonSaveOptions ovládat indexování listů, překonat prázdné řádky nebo přizpůsobit hypertextové odkazy.
 Čeština