如何使用C#将HTML转换为JSON#

如何使用C#将HTML转换为JSON#

将 HTML 转换为 JSON 允许开发人员从 Web 格式中提取结构化数据并将其用于数据导向的应用程序。 Aspose.Cells for .NET 使开发者能够有效和编程地加载 HTML 文件并以 JSON 形式出口其内容.

為什麼要將 HTML 轉換為 JSON?

  • 数据可传输:- 将表格的 HTML 数据转移到背景服务或 APIs 作为 JSON.

  • Web-to-App 集成:- 提取表或结构化网页内容,以便在应用程序中进行进一步处理.

  • 自动化准备:- 理想用于自动化网页扫描或内容提取过程.

步骤指南将 HTML 转换为 JSON

步骤 1: 通过 NuGet 安装 Aspose.Cells

安装 Aspose.Cells for .NET:

dotnet add package Aspose.Cells

步骤2:设置许可证

提供完整的功能:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

步骤3:下载 HTML 文件

通过加载 HTML 输入创建一个新的工作簿:

Workbook workbook = new Workbook("Sample.html");

步骤4:进入最后一个细胞

在工作表中识别最后一个单元格,以确定出口边界:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

步骤5:定义出口范围

创建一个包含工作表数据的范围:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

步骤6:设置 JsonSaveOptions

设置任何出口选项:

JsonSaveOptions options = new JsonSaveOptions();

步骤7:向JSON出口

序列定义范围到 JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

步骤8:将 JSON 保存到文件中

将输出写在磁盘上:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

常见问题和解决方案

1、空出口

  • 解决方案:确保 HTML 文件包含基于表的结构化内容,以便有效的数据识别.

二、不正确的范围

  • 解決方案:雙重檢查範圍包含工作表中的所有相關細胞.

3、出口格式化

  • 解決方案:使用 JsonSaveOptions 控制表索引,跳过空行,或自定义超链接.
 中文