Cómo convertir HTML a JSON utilizando C#

Cómo convertir HTML a JSON utilizando C#

Convertir HTML en JSON Permite a los desarrolladores extraer datos estructurados de los formatos web y utilizarlo en aplicaciones basadas en datos. Aspose.Cells para .NET permite al desarrollador cargar archivos HTML y exportar su contenido como JSON de manera eficiente y programática.

Por qué convertir HTML en JSON?

  • Portabilidad de datos:- Transferir datos tabulares de HTML a servicios de backend o APIs como JSON.

  • Integración web a la aplicación:- Extraer tablas o contenidos web estructurados para procesamiento adicional en aplicaciones.

  • Automación preparada:- Ideal para automatizar los procesos de web scraping o extracción de contenido.

Guía paso a paso para convertir HTML en JSON

Paso 1: Instalar Aspose.Cells mediante NuGet

Instalar Aspose.Cells para .NET:

dotnet add package Aspose.Cells

Paso 2: Instalar la licencia

Permite una funcionalidad completa:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Paso 3: Cargar archivos HTML

Crea un nuevo libro de trabajo cargando la entrada de HTML:

Workbook workbook = new Workbook("Sample.html");

Paso 4: Acceso a la última célula

Identificar la última célula en la hoja de trabajo para definir los límites de exportación:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Paso 5: Definición del rango de exportación

Crea un rango que abarca los datos de la hoja de trabajo:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Paso 6: Configure JsonSaveOptions

Establecer las opciones de exportación:

JsonSaveOptions options = new JsonSaveOptions();

Paso 7: Exportación a JSON

Serializar el rango definido a JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Paso 8: Salva JSON en el archivo

Escribe la salida al disco:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problemas y soluciones comunes

1 La salida vacía

  • Solución: Asegúrese de que el archivo HTML contiene contenido estructurado basado en la tabla para el reconocimiento de datos válido.

Rango incorrecto

  • Solución: Double-check que el rango incluye todas las células relevantes de la hoja de trabajo.

Formato de exportación

  • Solución : Usar JsonSaveOptions para controlar la indicación de las hojas, saltar las líneas vacías, o personalizar los hiperenlaces.
 Español