Jak převést HTML na JSON pomocí C#

Jak převést HTML na JSON pomocí C#

Konverze HTML na JSON umožňuje vývojářům extrahovat strukturovaná data z webových formátů a používat je v aplikacích řízených daty. Aspose.Cells pro .NET umožňuje vývojářům efektivně a programově načítat HTML soubory a exportovat jejich obsah jako JSON.

Proč konvertovat HTML na JSON?

  1. Přenositelnost dat:
    • Přeneste tabulková HTML data do backendových služeb nebo API jako JSON.
  2. Integrace webu a aplikace:
    • Extrahujte tabulkový nebo strukturovaný webový obsah pro další zpracování v aplikacích.
  3. Připraveno na automatizaci:
    • Ideální pro automatizaci procesů webového scrapingu nebo extrakce obsahu.

Krok za krokem průvodce konverzí HTML na JSON

Krok 1: Nainstalujte Aspose.Cells přes NuGet

Nainstalujte Aspose.Cells pro .NET:

dotnet add package Aspose.Cells

Krok 2: Nastavte licenci

Povolte plnou funkčnost:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Krok 3: Načtěte HTML soubor

Vytvořte nový pracovní sešit načtením HTML vstupu:

Workbook workbook = new Workbook("Sample.html");

Krok 4: Přístup k poslední buňce

Identifikujte poslední buňku v pracovním listu pro definování exportních hranic:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Krok 5: Definujte rozsah pro export

Vytvořte rozsah, který pokrývá data pracovního listu:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Krok 6: Nakonfigurujte JsonSaveOptions

Nastavte jakékoli exportní možnosti:

JsonSaveOptions options = new JsonSaveOptions();

Krok 7: Exportujte do JSON

Serializujte definovaný rozsah do JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Krok 8: Uložte JSON do souboru

Zapište výstup na disk:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Běžné problémy a řešení

1. Prázdný výstup

  • Řešení: Ujistěte se, že HTML soubor obsahuje tabulkově strukturovaný obsah pro platné rozpoznání dat.

2. Nesprávný rozsah

  • Řešení: Důkladně zkontrolujte, zda rozsah zahrnuje všechny relevantní buňky z pracovního listu.

3. Formátování exportu

  • Řešení: Použijte JsonSaveOptions pro řízení indexace listu, přeskočení prázdných řádků nebo přizpůsobení hypertextových odkazů.
 Čeština