Bagaimana untuk menukar HTML kepada JSON menggunakan C#

Bagaimana untuk menukar HTML kepada JSON menggunakan C#

Menukar HTML kepada JSON membolehkan pemaju untuk mengekstrak data terstruktur daripada format web dan menggunakannya dalam aplikasi berorientasikan data. Aspose.Cells untuk .NET memungkinkan pembangun untuk memuat naik fail HTML dan eksport kandungan mereka sebagai jSON dengan cekap dan berprogram.

Mengapa anda perlu menukar HTML kepada JSON?

  • Data yang boleh dipindahkan :- Memindahkan data HTML jadual ke perkhidmatan latar belakang atau API sebagai JSON.

  • ** Integrasi Web ke Aplikasi :**- Mengekstrak jadual atau kandungan web berstruktur untuk pemprosesan lanjut dalam aplikasi.

  • Penggunaan automatik bersedia :- Ideal untuk automatik web scraping atau proses pengekstrakan kandungan.

Langkah-langkah panduan untuk menukar HTML kepada JSON

Langkah 1: Instal Aspose.Cells melalui NuGet

Pemasangan Aspose.Cells untuk .NET :

dotnet add package Aspose.Cells

Langkah 2: Menetapkan lesen

Membolehkan fungsi penuh:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Langkah 3: Muat turun fail HTML

Mencipta buku kerja baru dengan memuat naik input HTML:

Workbook workbook = new Workbook("Sample.html");

Langkah 4: Akses kepada sel terakhir

Mengenalpasti sel terakhir dalam lembaran kerja untuk menentukan sempadan eksport:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Langkah 5: Menentukan julat untuk eksport

Mencipta julat yang merangkumi data lembaran kerja:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Langkah 6: Mengesetkan JsonSaveOptions

Menetapkan mana-mana pilihan eksport:

JsonSaveOptions options = new JsonSaveOptions();

Langkah 7: Eksport ke JSON

Serialisasikan julat yang ditakrifkan kepada JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Langkah 8: Simpan JSON ke fail

Tuliskan output ke cakera:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Masalah dan penyelesaian umum

1. pengeluaran kosong

  • ** Penyelesaian** : Pastikan fail HTML mengandungi kandungan berstruktur berasaskan jadual untuk pengenalan data yang sah.

2. rangkaian yang tidak betul

  • ** Penyelesaian** : Double-check bahawa julat termasuk semua sel yang berkaitan dari lembaran kerja.

3. pengeksportan format

  • Penyelesaian : Penggunaan JsonSaveOptions untuk mengawal indeks lembaran, melarikan diri baris kosong, atau menyesuaikan hiperpautan.
 Melayu