چگونه به تبدیل PDF به Excel (XLS / XLSX / CSV) در .NET

چگونه به تبدیل PDF به Excel (XLS / XLSX / CSV) در .NET

این مقاله نشان می دهد که چگونه به طور برنامه نویسی تبدیل اسناد PDF به فرمت های مایکروسافت اکسل (XLS، XLSX، CSV، و بیشتر) با استفاده از Aspose.PDF XLS Converter برای .NET. این به شما امکان باز کردن، تجزیه و تحلیل و اتوماتیک انتقال داده ها از PDF ها به صفحات برای پردازش بیشتر، گزارش و یا آرشیو.

مشکل دنیای واقعی

صادرات جدول ها یا داده های ساختار یافته از فایل های PDF به اکسل به صورت دستی کارآفرین و بدون خطا است. اتوماسیون این تبدیل برای جریان های کاری در امور مالی، گزارش، تجزیه و تحلیل و انطباق که در آن عملیات عمده PDF- به پهنای باند مورد نیاز است، ضروری است .

بررسی راه حل

Aspose.PDF XLS Converter برای .NET به شما اجازه می دهد:

  • تبدیل یک یا چند فایل PDF به فایل های اکسل (XLSX، XLS، CSV، ODS، XML)
  • کنترل ساختار ورق کار و فرمت
  • یکپارچه سازی صاف با پروژه های C#/NET برای اتوماسیون مقیاس پذیر

پیش شرط

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر
  • Aspose.PDF برای .NET نصب شده از طریق NuGet
PM> Install-Package Aspose.PDF

پیاده سازی گام به گام

مرحله اول: مکان های نامی مورد نیاز

using Aspose.Pdf.Plugins;
using System.IO;

مرحله 2: تبدیل یک PDF به XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

استفاده از موارد و برنامه ها (با تغییرات کد)

1. صادرات به CSV، XLS، ODS یا XML

مشخص کردن فرمت خروجی مورد نظر با استفاده از Format املاک :

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.Excelفورمات برای تمام فرمت های پشتیبانی شده

2. Batch تبدیل PDF های چندگانه به Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. تعداد کارگاه ها را به حداقل برسانید

به طور پیش فرض، هر صفحه PDF تبدیل به یک صفحه کار جدید اکسل می شود.برای ذخیره تمام محتوا در یک ورق کار:

options.MinimizeTheNumberOfWorksheets = true;

4. در ابتدا یک ستون سفید را وارد کنید

برای برخی سناریوهای واردات داده، ممکن است بخواهید یک ستون سفید را به عنوان ستون اول اضافه کنید:

options.InsertBlankColumnAtFirst = true;

بهترین روش ها و راهنمایی ها

  • پیش نمایش خروجی برای تأیید طرح جدول و یکپارچگی داده ها، به ویژه هنگام استفاده از گزینه های طرح پیشرفته.
  • برای اسناد بزرگ، از پردازش بسته برای اتوماسیون تبدیل عمده به طور موثر استفاده کنید.
  • هنگامی که به CSV تبدیل می شود، دلیمیترها و رمزگذاری را برای سازگاری با جریان پایین بررسی کنید.
  • برای PDF های بسیار ساختار یافته یا اسکن شده، اسناد پیش پردازش برای بهترین نتایج.

نمونه کامل اجرای

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

نتیجه گیری

Aspose.PDF XLS Converter برای .NET امکان اتوماسیون سریع، قوی و انعطاف پذیر PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) در پروژه های C# را فراهم می کند.Data from PDFs, streamline analytics, and integrate spreadsheet workflows – all with a simple, high-performance API.

پرسش های مکرر

**Q: چه فرمت هایی را می توانم به غیر از XLSX صادر کنم؟**A: فرمت های پشتیبانی شده شامل XLSX، XLSM، CSV، ODS و Excel 2003 XML است. Format املاک را انتخاب کنید.

**Q: چگونه می توانم تمام محتوای PDF را در یک صفحه کار ذخیره کنم؟**A : تنظیمات MinimizeTheNumberOfWorksheets = true بر روی شما PdfToXlsOptions.

**Q: کجا می توانم نمونه های بیشتری پیدا کنم یا پشتیبانی دریافت کنم؟**A: به اسناد رسمی Aspose.PDF، API Reference یا پشتیبانی تماس برای سناریوهای پیشرفته مراجعه کنید.

 فارسی