Como Converter HTML para JSON usando C#

Como Converter HTML para JSON usando C#

Converter HTML para JSON permite que os desenvolvedores extraiam dados estruturados de formatos da web e os utilizem em aplicações orientadas a dados. Aspose.Cells for .NET permite que os desenvolvedores carreguem arquivos HTML e exportem seu conteúdo como JSON de forma eficiente e programática.

Por que Converter HTML para JSON?

  1. Portabilidade de Dados:
    • Transfira dados tabulares em HTML para serviços de backend ou APIs como JSON.
  2. Integração Web-App:
    • Extraia conteúdo de tabela ou estruturado da web para processamento adicional em aplicativos.
  3. Pronto para Automação:
    • Ideal para automatizar processos de raspagem da web ou extração de conteúdo.

Guia Passo a Passo para Converter HTML em JSON

Passo 1: Instalar Aspose.Cells via NuGet

Instale Aspose.Cells for .NET:

dotnet add package Aspose.Cells

Passo 2: Configurar Licença

Habilite a funcionalidade completa:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Passo 3: Carregar Arquivo HTML

Crie uma nova pasta de trabalho carregando a entrada HTML:

Workbook workbook = new Workbook("Sample.html");

Passo 4: Acessar a Última Célula

Identifique a última célula na planilha para definir os limites de exportação:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Passo 5: Definir Intervalo para Exportação

Crie um intervalo que abranja os dados da planilha:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Passo 6: Configurar JsonSaveOptions

Defina quaisquer opções de exportação:

JsonSaveOptions options = new JsonSaveOptions();

Passo 7: Exportar para JSON

Serialize o intervalo definido para JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Passo 8: Salvar JSON em Arquivo

Escreva a saída no disco:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problemas Comuns e Soluções

1. Saída Vazia

  • Solução: Certifique-se de que o arquivo HTML contenha conteúdo estruturado baseado em tabela para reconhecimento válido de dados.

2. Intervalo Incorreto

  • Solução: Verifique se o intervalo inclui todas as células relevantes da planilha.

3. Formatação da Exportação

  • Solução: Use JsonSaveOptions para controlar a indexação da planilha, pular linhas vazias ou personalizar hyperlinks.
 Português