Bagaimana untuk menukar HTML kepada JSON menggunakan C#
Menukar HTML kepada JSON membolehkan pemaju untuk mengekstrak data terstruktur daripada format web dan menggunakannya dalam aplikasi berorientasikan data. Aspose.Cells untuk .NET memungkinkan pembangun untuk memuat naik fail HTML dan eksport kandungan mereka sebagai jSON dengan cekap dan berprogram.
Mengapa anda perlu menukar HTML kepada JSON?
Data yang boleh dipindahkan :- Memindahkan data HTML jadual ke perkhidmatan latar belakang atau API sebagai JSON.
** Integrasi Web ke Aplikasi :**- Mengekstrak jadual atau kandungan web berstruktur untuk pemprosesan lanjut dalam aplikasi.
Penggunaan automatik bersedia :- Ideal untuk automatik web scraping atau proses pengekstrakan kandungan.
Langkah-langkah panduan untuk menukar HTML kepada JSON
Langkah 1: Instal Aspose.Cells melalui NuGet
Pemasangan Aspose.Cells untuk .NET :
dotnet add package Aspose.Cells
Langkah 2: Menetapkan lesen
Membolehkan fungsi penuh:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Langkah 3: Muat turun fail HTML
Mencipta buku kerja baru dengan memuat naik input HTML:
Workbook workbook = new Workbook("Sample.html");
Langkah 4: Akses kepada sel terakhir
Mengenalpasti sel terakhir dalam lembaran kerja untuk menentukan sempadan eksport:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Langkah 5: Menentukan julat untuk eksport
Mencipta julat yang merangkumi data lembaran kerja:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Langkah 6: Mengesetkan JsonSaveOptions
Menetapkan mana-mana pilihan eksport:
JsonSaveOptions options = new JsonSaveOptions();
Langkah 7: Eksport ke JSON
Serialisasikan julat yang ditakrifkan kepada JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Langkah 8: Simpan JSON ke fail
Tuliskan output ke cakera:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Masalah dan penyelesaian umum
1. pengeluaran kosong
- ** Penyelesaian** : Pastikan fail HTML mengandungi kandungan berstruktur berasaskan jadual untuk pengenalan data yang sah.
2. rangkaian yang tidak betul
- ** Penyelesaian** : Double-check bahawa julat termasuk semua sel yang berkaitan dari lembaran kerja.
3. pengeksportan format
- Penyelesaian : Penggunaan
JsonSaveOptions
untuk mengawal indeks lembaran, melarikan diri baris kosong, atau menyesuaikan hiperpautan.