Як конвертувати HTML в JSON за допомогою C#
Перетворення HTML на JSON Це дозволяє розробникам витягувати структуровані дані з веб-форматів і використовувати їх у програмах, що керуються даними. Aspose.Cells для .NET дозволить розробцям завантажувати HTML-файли і експортувати їх вміст як JSON ефективно і програматично.
Чому потрібно перетворювати HTML на JSON?
Переносимість даних:- Передача табличних даних HTML на сервіси бакалавра або АПІ як JSON.
Інтеграція веб-на-прикладу:- Витяг таблиці або структурованого веб-контенту для подальшої обробки в додатках.
Автоматизація готова:- Ідеальний для автоматизації процесів веб-скрейпінгу або видобутку контенту.
Крок за кроком Посібник для перетворення HTML на JSON
Крок 1: Налаштування Aspose.Cells через NuGet
Завантажити Aspose.Cells для .NET:
dotnet add package Aspose.Cells
Крок 2: Встановіть ліцензію
Забезпечити повну функціональність:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Крок 3: Завантажити файл HTML
Створіть нову робочу книжку, завантажуючи вхід HTML:
Workbook workbook = new Workbook("Sample.html");
Крок 4: Доступ до останньої клітини
Визначте останню клітину в робочому листі, щоб визначити експортні кордони:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Крок 5: Визначте обсяг експорту
Створіть діапазон, який розтягує дані робочого листа:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Крок 6: Налаштування JsonSaveOptions
Виберіть будь-які експортні варіанти:
JsonSaveOptions options = new JsonSaveOptions();
Крок 7: Експорт до JSON
Серіалізуйте визначений діапазон до JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Крок 8: Зберегти JSON до файлу
Напишіть вихід на диск:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Загальні питання та рішення
1 Порожній вихід
- Рішення: Переконайтеся, що файл HTML містить структурований контент на основі таблиці для дійсного розпізнавання даних.
Неправильний діапазон
- Рішення: подвійний перевірка того, що діапазон включає всі відповідні клітини з робочого листа.
Формування експорту
- Використання
JsonSaveOptions
контролювати індексування листівок, перервати порожні рядки або налаштувати гіперзв’язки.