Cách chuyển đổi HTML sang JSON bằng C#

Cách chuyển đổi HTML sang JSON bằng C#

Chuyển đổi HTML sang JSON cho phép các nhà phát triển trích xuất dữ liệu có cấu trúc từ các định dạng web và sử dụng nó trong các ứng dụng dựa trên dữ liệu. Aspose.Cells for .NET cho phép các nhà phát triển tải các tệp HTML và xuất nội dung của chúng dưới dạng JSON một cách hiệu quả và lập trình.

Tại sao lại chuyển đổi HTML sang JSON?

  1. Khả năng di chuyển dữ liệu:
    • Chuyển dữ liệu HTML dạng bảng vào các dịch vụ backend hoặc API dưới dạng JSON.
  2. Tích hợp Web-to-App:
    • Trích xuất nội dung web có cấu trúc hoặc bảng để xử lý thêm trong các ứng dụng.
  3. Sẵn sàng tự động hóa:
    • Lý tưởng cho việc tự động hóa quy trình thu thập dữ liệu từ web hoặc trích xuất nội dung.

Hướng dẫn từng bước để chuyển đổi HTML sang JSON

Bước 1: Cài đặt Aspose.Cells qua NuGet

Cài đặt Aspose.Cells for .NET:

dotnet add package Aspose.Cells

Bước 2: Thiết lập Giấy phép

Kích hoạt đầy đủ chức năng:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Bước 3: Tải tệp HTML

Tạo một workbook mới bằng cách tải đầu vào HTML:

Workbook workbook = new Workbook("Sample.html");

Bước 4: Truy cập ô cuối cùng

Xác định ô cuối cùng trong bảng tính để xác định ranh giới xuất khẩu:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Bước 5: Định nghĩa Phạm vi để Xuất

Tạo một phạm vi bao trùm dữ liệu bảng tính:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Bước 6: Cấu hình JsonSaveOptions

Đặt bất kỳ tùy chọn xuất khẩu nào:

JsonSaveOptions options = new JsonSaveOptions();

Bước 7: Xuất sang JSON

Tuần tự hóa phạm vi đã định nghĩa sang JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Bước 8: Lưu JSON vào tệp

Ghi đầu ra vào ổ đĩa:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Các vấn đề thường gặp và cách khắc phục

1. Đầu ra trống

  • Giải pháp: Đảm bảo tệp HTML chứa nội dung có cấu trúc dạng bảng để nhận diện dữ liệu hợp lệ.

2. Phạm vi không chính xác

  • Giải pháp: Kiểm tra kỹ rằng phạm vi bao gồm tất cả các ô liên quan từ bảng tính.

3. Định dạng xuất khẩu

  • Giải pháp: Sử dụng JsonSaveOptions để kiểm soát chỉ số bảng, bỏ qua các hàng trống hoặc tùy chỉnh các liên kết.
 Tiếng Việt