如何使用C#将HTML转换为JSON#
如何使用C#将HTML转换为JSON#
将 HTML 转换为 JSON 允许开发人员从 Web 格式中提取结构化数据并将其用于数据导向的应用程序。 Aspose.Cells for .NET 使开发者能够有效和编程地加载 HTML 文件并以 JSON 形式出口其内容.
為什麼要將 HTML 轉換為 JSON?
数据可传输:- 将表格的 HTML 数据转移到背景服务或 APIs 作为 JSON.
Web-to-App 集成:- 提取表或结构化网页内容,以便在应用程序中进行进一步处理.
自动化准备:- 理想用于自动化网页扫描或内容提取过程.
步骤指南将 HTML 转换为 JSON
步骤 1: 通过 NuGet 安装 Aspose.Cells
安装 Aspose.Cells for .NET:
dotnet add package Aspose.Cells
步骤2:设置许可证
提供完整的功能:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
步骤3:下载 HTML 文件
通过加载 HTML 输入创建一个新的工作簿:
Workbook workbook = new Workbook("Sample.html");
步骤4:进入最后一个细胞
在工作表中识别最后一个单元格,以确定出口边界:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
步骤5:定义出口范围
创建一个包含工作表数据的范围:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
步骤6:设置 JsonSaveOptions
设置任何出口选项:
JsonSaveOptions options = new JsonSaveOptions();
步骤7:向JSON出口
序列定义范围到 JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
步骤8:将 JSON 保存到文件中
将输出写在磁盘上:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
常见问题和解决方案
1、空出口
- 解决方案:确保 HTML 文件包含基于表的结构化内容,以便有效的数据识别.
二、不正确的范围
- 解決方案:雙重檢查範圍包含工作表中的所有相關細胞.
3、出口格式化
- 解決方案:使用
JsonSaveOptions
控制表索引,跳过空行,或自定义超链接.