Як конвертувати HTML в JSON за допомогою C#

Як конвертувати HTML в JSON за допомогою C#

Перетворення HTML на JSON Це дозволяє розробникам витягувати структуровані дані з веб-форматів і використовувати їх у програмах, що керуються даними. Aspose.Cells для .NET дозволить розробцям завантажувати HTML-файли і експортувати їх вміст як JSON ефективно і програматично.

Чому потрібно перетворювати HTML на JSON?

  • Переносимість даних:- Передача табличних даних HTML на сервіси бакалавра або АПІ як JSON.

  • Інтеграція веб-на-прикладу:- Витяг таблиці або структурованого веб-контенту для подальшої обробки в додатках.

  • Автоматизація готова:- Ідеальний для автоматизації процесів веб-скрейпінгу або видобутку контенту.

Крок за кроком Посібник для перетворення HTML на JSON

Крок 1: Налаштування Aspose.Cells через NuGet

Завантажити Aspose.Cells для .NET:

dotnet add package Aspose.Cells

Крок 2: Встановіть ліцензію

Забезпечити повну функціональність:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Крок 3: Завантажити файл HTML

Створіть нову робочу книжку, завантажуючи вхід HTML:

Workbook workbook = new Workbook("Sample.html");

Крок 4: Доступ до останньої клітини

Визначте останню клітину в робочому листі, щоб визначити експортні кордони:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Крок 5: Визначте обсяг експорту

Створіть діапазон, який розтягує дані робочого листа:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Крок 6: Налаштування JsonSaveOptions

Виберіть будь-які експортні варіанти:

JsonSaveOptions options = new JsonSaveOptions();

Крок 7: Експорт до JSON

Серіалізуйте визначений діапазон до JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Крок 8: Зберегти JSON до файлу

Напишіть вихід на диск:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Загальні питання та рішення

1 Порожній вихід

  • Рішення: Переконайтеся, що файл HTML містить структурований контент на основі таблиці для дійсного розпізнавання даних.

Неправильний діапазон

  • Рішення: подвійний перевірка того, що діапазон включає всі відповідні клітини з робочого листа.

Формування експорту

  • Використання JsonSaveOptions контролювати індексування листівок, перервати порожні рядки або налаштувати гіперзв’язки.
 Українська