Cách chuyển đổi HTML sang JSON bằng C#
Chuyển đổi HTML sang JSON cho phép các nhà phát triển khai thác dữ liệu có cấu trúc từ các định dạng web và sử dụng nó trong các ứng dụng dựa trên thông tin. Aspose.Cells for .NET cho thấy người phát hành có thể tải các tập tin HTML và xuất nội dung của họ như JSON một cách hiệu quả và lập trình.
Tại sao chuyển đổi HTML sang JSON?
Tính năng truyền dữ liệu:- Chuyển dữ liệu HTML bảng sang các dịch vụ sau hoặc APIs như JSON.
Kết nối web-to-app:- Chiết xuất bảng hoặc nội dung web có cấu trúc để xử lý thêm trong các ứng dụng.
Tự động sẵn sàng:- Tốt nhất cho việc tự động hóa các quy trình web scraping hoặc nội dung khai thác.
Hướng dẫn từng bước để chuyển đổi HTML sang JSON
Bước 1: Cài đặt Aspose.Cells qua NuGet
Cài đặt Aspose.Cells cho .NET:
dotnet add package Aspose.Cells
Bước 2: Tạo giấy phép
Khả năng hoạt động đầy đủ:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Bước 3: Tải file HTML
Tạo một sổ làm việc mới bằng cách tải nhập HTML:
Workbook workbook = new Workbook("Sample.html");
Bước 4: Truy cập vào tế bào cuối cùng
Xác định ô cuối cùng trong bảng tính để xác định giới hạn xuất khẩu:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Bước 5: Xác định phạm vi xuất khẩu
Tạo một phạm vi mở rộng dữ liệu sổ làm việc:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Bước 6: Thiết lập JsonSaveOptions
Cài đặt bất kỳ tùy chọn xuất khẩu:
JsonSaveOptions options = new JsonSaveOptions();
Bước 7: Xuất sang JSON
Xác định phạm vi định nghĩa cho JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Bước 8: Save JSON to File
Viết output vào đĩa:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Các vấn đề chung và Fixes
1.Khả năng trống
- Giải pháp: Hãy chắc chắn rằng tệp HTML chứa nội dung có cấu trúc dựa trên bảng để nhận dạng dữ liệu có hiệu lực.
2. không đúng phạm vi
- Solution: Double-check rằng phạm vi bao gồm tất cả các ô liên quan từ bảng tính.
3. hình thức xuất khẩu
- Giải pháp : Sử dụng
JsonSaveOptions
để kiểm soát indexing sheet, vượt qua các hàng trống, hoặc tùy chỉnh hyperlinks.