Ako premeniť HTML na JSON pomocou C#
Konverzia HTML na JSON umožňuje vývojárom extrahovať štruktúrované údaje z webových formátov a používať ich v aplikáciách na báze údajov. Aspose.Cells for .NET umožňuje vývojárom nahrať HTML súbory a exportovať ich obsah ako JSON efektívne a programovateľne.
Prečo premeniť HTML na JSON?
Portabilita údajov:- Prenos tabuľkových HTML údajov do backend služieb alebo API ako JSON.
Integrovanie webových stránok do aplikácií:- Extrakt tabuľky alebo štruktúrovaný webový obsah pre ďalšie spracovanie v aplikáciách.
Automatizácia je pripravená:- Ideálne pre automatizáciu web scrapingu alebo procesov extrakcie obsahu.
Krok za krokom sprievodca premenou HTML na JSON
Krok 1: Inštalácia Aspose.Cells prostredníctvom NuGet
Inštalácia Aspose.Cells pre .NET:
dotnet add package Aspose.Cells
Krok 2: Nastavenie licencie
Umožňuje plnú funkčnosť:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Krok 3: Nahrať HTML súbory
Vytvorte novú pracovnú knihu nahrávaním vstupu HTML:
Workbook workbook = new Workbook("Sample.html");
Krok 4: Prístup k poslednej bunke
Identifikujte poslednú bunku v pracovnej doske, aby ste definovali vývozné hranice:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Krok 5: Zadajte rozsah vývozu
Vytvorte rozsah, ktorý rozširuje údaje o pracovnej doske:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Krok 6: Nastavenie JsonSaveOptions
Zadajte všetky možnosti vývozu:
JsonSaveOptions options = new JsonSaveOptions();
Krok 7: Export na JSON
Serializujte definovaný rozsah na JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Krok 8: Uložiť JSON do súboru
Napíšte výstup na disk:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Spoločné problémy a riešenia
1. prázdny výstup
- Riešenie: Uistite sa, že súbor HTML obsahuje tabuľkový štruktúrovaný obsah pre platné rozpoznávanie údajov.
2. nesprávny rozsah
- Riešenie: Dvojnásobne skontrolujte, že rozsah obsahuje všetky relevantné bunky z pracovnej dosky.
Formátovanie vývozu
- Solution: Use
JsonSaveOptions
to control sheet indexing, skip empty rows, or customize hyperlinks.