Cách chuyển đổi HTML sang JSON bằng C#

Cách chuyển đổi HTML sang JSON bằng C#

Chuyển đổi HTML sang JSON cho phép các nhà phát triển khai thác dữ liệu có cấu trúc từ các định dạng web và sử dụng nó trong các ứng dụng dựa trên thông tin. Aspose.Cells for .NET cho thấy người phát hành có thể tải các tập tin HTML và xuất nội dung của họ như JSON một cách hiệu quả và lập trình.

Tại sao chuyển đổi HTML sang JSON?

  • Tính năng truyền dữ liệu:- Chuyển dữ liệu HTML bảng sang các dịch vụ sau hoặc APIs như JSON.

  • Kết nối web-to-app:- Chiết xuất bảng hoặc nội dung web có cấu trúc để xử lý thêm trong các ứng dụng.

  • Tự động sẵn sàng:- Tốt nhất cho việc tự động hóa các quy trình web scraping hoặc nội dung khai thác.

Hướng dẫn từng bước để chuyển đổi HTML sang JSON

Bước 1: Cài đặt Aspose.Cells qua NuGet

Cài đặt Aspose.Cells cho .NET:

dotnet add package Aspose.Cells

Bước 2: Tạo giấy phép

Khả năng hoạt động đầy đủ:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Bước 3: Tải file HTML

Tạo một sổ làm việc mới bằng cách tải nhập HTML:

Workbook workbook = new Workbook("Sample.html");

Bước 4: Truy cập vào tế bào cuối cùng

Xác định ô cuối cùng trong bảng tính để xác định giới hạn xuất khẩu:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Bước 5: Xác định phạm vi xuất khẩu

Tạo một phạm vi mở rộng dữ liệu sổ làm việc:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Bước 6: Thiết lập JsonSaveOptions

Cài đặt bất kỳ tùy chọn xuất khẩu:

JsonSaveOptions options = new JsonSaveOptions();

Bước 7: Xuất sang JSON

Xác định phạm vi định nghĩa cho JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Bước 8: Save JSON to File

Viết output vào đĩa:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Các vấn đề chung và Fixes

1.Khả năng trống

  • Giải pháp: Hãy chắc chắn rằng tệp HTML chứa nội dung có cấu trúc dựa trên bảng để nhận dạng dữ liệu có hiệu lực.

2. không đúng phạm vi

  • Solution: Double-check rằng phạm vi bao gồm tất cả các ô liên quan từ bảng tính.

3. hình thức xuất khẩu

  • Giải pháp : Sử dụng JsonSaveOptions để kiểm soát indexing sheet, vượt qua các hàng trống, hoặc tùy chỉnh hyperlinks.
 Tiếng Việt