Cara Mengonversi HTML ke JSON menggunakan C#

Cara Mengonversi HTML ke JSON menggunakan C#

Mengonversi HTML ke JSON memungkinkan pengembang untuk mengekstrak data terstruktur dari format web dan menggunakannya dalam aplikasi yang berbasis data. Aspose.Cells untuk .NET memungkinkan pengembang untuk memuat file HTML dan mengekspor kontennya sebagai JSON dengan efisien dan secara programatis.

Mengapa Mengonversi HTML ke JSON?

  1. Portabilitas Data:
    • Transfer data HTML berbasis tabel ke layanan backend atau API sebagai JSON.
  2. Integrasi Web ke Aplikasi:
    • Ekstrak tabel atau konten web terstruktur untuk pemrosesan lebih lanjut dalam aplikasi.
  3. Siap untuk Automasi:
    • Ideal untuk mengotomatisasi proses pengambilan data web atau ekstraksi konten.

Panduan Langkah-demi-Langkah untuk Mengonversi HTML ke JSON

Langkah 1: Instal Aspose.Cells melalui NuGet

Instal Aspose.Cells untuk .NET:

dotnet add package Aspose.Cells

Langkah 2: Atur Lisensi

Aktifkan fungsionalitas penuh:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Langkah 3: Muat File HTML

Buat workbook baru dengan memuat input HTML:

Workbook workbook = new Workbook("Sample.html");

Langkah 4: Akses Sel Terakhir

Identifikasi sel terakhir di worksheet untuk mendefinisikan batas ekspor:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Langkah 5: Definisikan Rentang untuk Ekspor

Buat rentang yang mencakup data worksheet:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Langkah 6: Konfigurasi JsonSaveOptions

Atur opsi ekspor apa pun:

JsonSaveOptions options = new JsonSaveOptions();

Langkah 7: Ekspor ke JSON

Serialisasikan rentang yang telah ditentukan ke JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Langkah 8: Simpan JSON ke File

Tulis output ke disk:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Masalah Umum dan Solusinya

1. Output Kosong

  • Solusi: Pastikan file HTML berisi konten terstruktur berbasis tabel untuk pengenalan data yang valid.

2. Rentang Tidak Tepat

  • Solusi: Periksa kembali bahwa rentang mencakup semua sel relevan dari worksheet.

3. Format Ekspor

  • Solusi: Gunakan JsonSaveOptions untuk mengontrol pengindeksan sheet, melewati baris kosong, atau menyesuaikan hyperlink.
 Indonesia