كيفية تحويل PDF إلى Excel (XLS / XLSX / CSV) في .NET

كيفية تحويل PDF إلى Excel (XLS / XLSX / CSV) في .NET

يظهر هذا المقال كيفية تحويل مستندات PDF ببرمجيات إلى تنسيقات Microsoft Excel (XLS، XLSX، CSV، وما إلى ذلك) باستخدام Aspose.PDF XLS Converter for .NET. وهذا يتيح لك تفكيك وتحليل وتحويل البيانات تلقائيًا من ملفات PDF إلى لوحات المفاتيح لمزيد من المعالجة أو الإبلاغ أو الأرشيف.

مشكلة العالم الحقيقي

تصدير اللوحات أو البيانات المنظمة من PDFs إلى Excel يدويا هو عمل مكثف ومخالفة للخطأ. تلقائي هذا التحويل أمر حيوي لتدفقات العمل في التمويل والإبلاغ والتحليل والامتثال حيث تحتاج العمليات الكبيرة PDF-to- spreadsheet.

نظرة عامة على الحل

Aspose.PDF XLS Converter for .NET يتيح لك:

  • تحويل ملفات PDF واحدة أو متعددة إلى ملف Excel (XLSX، XLS، CSV، ODS، XML)
  • التحكم في هيكل ورقة العمل وتصميمها
  • التكامل بسلاسة مع مشاريع C#/NET لتطوير الأتمتة القصوى

المتطلبات

  • Visual Studio 2019 أو أحدث
  • .NET 6.0 أو أحدث
  • Aspose.PDF for .NET متوفر عبر NuGet
PM> Install-Package Aspose.PDF

تنفيذ خطوة بخطوة

الخطوة 1: الإشارة إلى مساحات الاسم المطلوبة

using Aspose.Pdf.Plugins;
using System.IO;

الخطوة 2: تحويل PDF إلى XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

استخدام الحالات والتطبيقات (مع تعديلات الرمز)

1. تصدير إلى CSV أو XLS أو ODS أو XML

تحديد النموذج المطلوب باستخدام Format الممتلكات :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsالخيارات.ExcelFormat جميع النماذج المدعومة.

2. Batch تحويل PDFs متعددة إلى Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. الحد الأدنى لعدد ورش العمل

بشكل افتراضي ، تصبح كل صفحة PDF ورقة عمل جديدة في Excel.

options.MinimizeTheNumberOfWorksheets = true;

4. إدخال عمود أبيض في البداية

بالنسبة لبعض سيناريوهات استيراد البيانات، قد ترغب في إضافة عمود أبيض كعمود الأول:

options.InsertBlankColumnAtFirst = true;

أفضل الممارسات والنصائح

  • إظهار النتيجة للتحقق من ترتيب الجدول وسلامة البيانات، وخاصة عند استخدام خيارات التخطيط المتقدمة.
  • بالنسبة للمستندات الكبيرة ، استخدم معالجة الحزمة لتلقائي تحويل الحجم بكفاءة.
  • عند التحويل إلى CSV ، تحقق من التمييزات والتشفير للحصول على التوافق السفلي.
  • بالنسبة لملفات PDF ذات الهيكل العالي أو المسح الضوئي، وثائق ما قبل العملية للحصول على أفضل النتائج.

نموذج تنفيذ كامل

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

استنتاجات

يتيح Aspose.PDF XLS Converter for .NET أوتوماتيك PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) سريع ومستقر ومرن في مشاريع C#. إلغاء قفل البيانات من PDFs ، وتحليلات السلسلة ، وتكامل تدفقات ورقة العمل - كلها مع API بسيطة وذات الأداء العالي.

الأسئلة المتكررة

**س: ما هي الأشكال التي يمكنني تصديرها إلى XLSX؟**A: تشمل تنسيقات الدعم XLSX، XLSM، CSV، ODS، و Excel 2003 XML. Format الممتلكات التي يمكن اختيارها.

**س: كيف يمكنني حفظ كل محتوى PDF في ورقة عمل واحدة؟**A : مجموعة MinimizeTheNumberOfWorksheets = true على الخاص بك PdfToXlsOptions.

**س: أين يمكنني العثور على المزيد من الأمثلة أو الحصول على الدعم؟**A: انظر الوثيقة الرسمية Aspose.PDF، إشارة API، أو دعم الاتصال للمشاهد المتقدمة.

 عربي