Як конвертувати HTML в JSON за допомогою C#

Як конвертувати HTML в JSON за допомогою C#

Перетворення HTML в JSON дозволяє розробникам витягувати структуровані дані з веб-форматів і використовувати їх у додатках, орієнтованих на дані. Aspose.Cells для .NET дозволяє розробникам завантажувати HTML-файли та ефективно і програмно експортувати їх вміст у форматі JSON.

Чому варто перетворювати HTML в JSON?

  1. Переносимість даних:
    • Переносити табличні дані HTML у бекенд-сервіси або API у форматі JSON.
  2. Інтеграція веб-додатків:
    • Витягувати таблиці або структурований веб-вміст для подальшої обробки в додатках.
  3. Готовність до автоматизації:
    • Ідеально підходить для автоматизації процесів веб-скрапінгу або витягування вмісту.

Покрокова інструкція з перетворення HTML в JSON

Крок 1: Встановіть Aspose.Cells через NuGet

Встановіть Aspose.Cells для .NET:

dotnet add package Aspose.Cells

Крок 2: Налаштуйте ліцензію

Увімкніть повну функціональність:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Крок 3: Завантажте HTML-файл

Створіть нову книгу, завантаживши HTML-вхід:

Workbook workbook = new Workbook("Sample.html");

Крок 4: Отримайте останню клітинку

Визначте останню клітинку в аркуші, щоб визначити межі експорту:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Крок 5: Визначте діапазон для експорту

Створіть діапазон, що охоплює дані аркуша:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Крок 6: Налаштуйте JsonSaveOptions

Встановіть будь-які параметри експорту:

JsonSaveOptions options = new JsonSaveOptions();

Крок 7: Експортуйте в JSON

Серіалізуйте визначений діапазон у JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Крок 8: Збережіть JSON у файл

Запишіть вихідні дані на диск:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Загальні проблеми та їх вирішення

1. Порожній вихід

  • Рішення: Переконайтеся, що HTML-файл містить структурований вміст на основі таблиць для вірного розпізнавання даних.

2. Неправильний діапазон

  • Рішення: Двічі перевірте, що діапазон включає всі відповідні клітинки з аркуша.

3. Форматування експорту

  • Рішення: Використовуйте JsonSaveOptions, щоб контролювати індексацію аркушів, пропускати порожні рядки або налаштовувати гіперпосилання.
 Українська