Как конвертировать HTML в JSON с использованием C#

Как конвертировать HTML в JSON с использованием C#

Конвертировать HTML в JSON Разработчики могут извлечь структурированные данные из веб-форматов и использовать их в приложениях, основанных на данных. Aspose.Cells для .NET позволяет разработчикам загружать HTML-файлы и экспортировать их содержимое в качестве JSON эффективно и программически.

Зачем переводить HTML в JSON?

  • Переносимость данных:- Передача табличных данных HTML в сервисы бакалавра или АПИ в качестве JSON.

  • Интеграция веб-на-приложении:- Экстракт таблицы или структурированного веб-контента для дальнейшей обработки в приложениях.

  • Автоматизация готова:- Идеально подходит для автоматизации веб-скарапинга или процессов извлечения контента.

Шаг за шагом Руководство для конвертации HTML в JSON

Шаг 1: Установка Aspose.Cells через NuGet

Настройка Aspose.Cells для .NET:

dotnet add package Aspose.Cells

Шаг 2: Установите лицензию

Обеспечивает полную функциональность:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Шаг 3: Загрузить HTML-файл

Создайте новую рабочую книгу, загружая вклад HTML:

Workbook workbook = new Workbook("Sample.html");

Шаг 4: Доступ к последней клетке

Идентификация последней клетки в рабочей таблице для определения экспортных границ:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Шаг 5: Определите объем экспорта

Создайте диапазон, который расширяет данные рабочего стола:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Шаг 6: Настройка JsonSaveOptions

Определите любые варианты экспорта:

JsonSaveOptions options = new JsonSaveOptions();

Шаг 7: Экспорт в JSON

Сериализируйте определенный диапазон к JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Шаг 8: Сохраните JSON в файле

Напишите выход на диск:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Общие проблемы и фиксации

1 пустый выход

  • Решение: Убедитесь, что HTML-файл содержит структурированный контент на основе таблицы для действительного распознавания данных.

2 Неправильный диапазон

  • Решение: Двойная проверка того, что диапазон включает все соответствующие клетки из рабочего стола.

Форматирование экспорта

  • Решение : Использование JsonSaveOptions контролировать индексирование листов, пересекать пустые строки или настроить гиперссылки.
 Русский