چگونه HTML را با استفاده از C# به JSON تبدیل کنیم

چگونه HTML را با استفاده از C# به JSON تبدیل کنیم

تبدیل HTML به JSON به توسعه‌دهندگان این امکان را می‌دهد که داده‌های ساخت‌یافته را از فرمت‌های وب استخراج کرده و در برنامه‌های مبتنی بر داده استفاده کنند. Aspose.Cells for .NET به توسعه‌دهندگان اجازه می‌دهد تا فایل‌های HTML را بارگذاری کرده و محتوای آن‌ها را به‌طور کارآمد و برنامه‌نویسی به JSON صادر کنند.

چرا HTML را به JSON تبدیل کنیم؟

  1. قابلیت جابه‌جایی داده‌ها:
    • انتقال داده‌های جدولی HTML به خدمات یا APIهای پشتیبان به‌صورت JSON.
  2. ادغام وب با برنامه:
    • استخراج محتوای جدول یا ساخت‌یافته وب برای پردازش بیشتر در برنامه‌ها.
  3. آماده برای اتوماسیون:
    • ایده‌آل برای اتوماسیون فرآیندهای وب‌اسکرپینگ یا استخراج محتوا.

راهنمای گام به گام برای تبدیل HTML به JSON

گام 1: نصب Aspose.Cells از طریق NuGet

نصب Aspose.Cells for .NET:

dotnet add package Aspose.Cells

گام 2: تنظیم مجوز

فعال‌سازی عملکرد کامل:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

گام 3: بارگذاری فایل HTML

ایجاد یک کاربرگ جدید با بارگذاری ورودی HTML:

Workbook workbook = new Workbook("Sample.html");

گام 4: دسترسی به آخرین سلول

شناسایی آخرین سلول در کاربرگ برای تعریف مرزهای صادرات:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

گام 5: تعریف محدوده برای صادرات

ایجاد یک محدوده که داده‌های کاربرگ را پوشش می‌دهد:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

گام 6: پیکربندی JsonSaveOptions

تنظیم هرگونه گزینه صادرات:

JsonSaveOptions options = new JsonSaveOptions();

گام 7: صادرات به JSON

سریال‌سازی محدوده تعریف‌شده به JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

گام 8: ذخیره JSON به فایل

نوشتن خروجی در دیسک:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

مشکلات رایج و راه‌حل‌ها

1. خروجی خالی

  • راه‌حل: اطمینان حاصل کنید که فایل HTML شامل محتوای ساخت‌یافته جدولی برای شناسایی داده‌های معتبر است.

2. محدوده نادرست

  • راه‌حل: دوباره بررسی کنید که محدوده شامل تمام سلول‌های مربوطه از کاربرگ باشد.

3. فرمت‌بندی صادرات

  • راه‌حل: از JsonSaveOptions برای کنترل ایندکس‌گذاری شیت، نادیده گرفتن ردیف‌های خالی یا سفارشی‌سازی هایپرلینک‌ها استفاده کنید.
 فارسی