Como Converter HTML para JSON usando C#

Como Converter HTML para JSON usando C#

Converter HTML para JSON Permite aos desenvolvedores extrair dados estruturados de formatos web e usá-los em aplicações baseadas em dados. Aspose.Cells para .NET permite que os desenvolvedores carregem arquivos HTML e exportem seus conteúdos como JSON de forma eficiente e programática.

Por que converter HTML para JSON?

  • Portabilidade de dados:- Transferir dados tabulares HTML para serviços de backend ou APIs como JSON.

  • Integração Web-to-App:- Extrair tabela ou conteúdo web estruturado para processamento adicional em aplicativos.

  • A automação está pronta:- Ideal para automatizar os processos de web scraping ou extração de conteúdo.

Guia passo a passo para converter HTML para JSON

Passo 1: Instalar Aspose.Cells através de NuGet

Instalar Aspose.Cells para .NET:

dotnet add package Aspose.Cells

Passo 2: Configurar a licença

Permite a funcionalidade completa:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Passo 3: Carregar arquivo HTML

Crie um novo livro de trabalho carregando a entrada HTML:

Workbook workbook = new Workbook("Sample.html");

Passo 4: Acesso à última célula

Identificar a última célula na folha de trabalho para definir limites de exportação:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Passo 5: Defina o limite de exportação

Crie uma faixa que expande os dados da folha de trabalho:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Passo 6: Configure JsonSaveOptions

Selecione todas as opções de exportação:

JsonSaveOptions options = new JsonSaveOptions();

Passo 7: Exportação para JSON

Serialize a faixa definida para JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Passo 8: Salve JSON para o arquivo

Escreva a saída para o disco:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problemas comuns e fixos

1 - A saída vazia

  • Solução: Assegure-se que o arquivo HTML contém conteúdo estruturado baseado em tabelas para reconhecimento de dados válidos.

2 – Range incorreto

  • Solução: Verifique duplo que a faixa inclui todas as células relevantes da folha de trabalho.

3 - Formato de Exportação

  • Solução Usar JsonSaveOptions para controlar o indexamento de folhas, escapar de linhas vazias ou personalizar hiperlinks.
 Português