چگونه به تبدیل PDF به Excel (XLS / XLSX / CSV) در .NET

چگونه به تبدیل PDF به Excel (XLS / XLSX / CSV) در .NET

این مقاله نشان می دهد که چگونه به طور برنامه نویسی تبدیل PDF اسناد در فرمت های مایکروسافت اکسل (XLS، XLSX، CSV، و بیشتر) با استفاده از Aspose.PDF XLS تبدیل برای .NET. این به شما امکان باز کردن، تجزیه و تحلیل و اتوماتیک انتقال داده ها از فایل های PDF به صفحات برای پردازش بیشتر، گزارش یا آرشیو را فراهم می کند.

مشکل دنیای واقعی

صادرات جدول ها یا داده های ساختار یافته از فایل های PDF به اکسل به صورت دستی کارآفرین و بدون خطا است. اتوماسیون این تبدیل برای جریان های کاری در امور مالی، گزارش، تجزیه و تحلیل و انطباق که در آن عملیات عمده PDF- به پهنای باند مورد نیاز است، ضروری است.

بررسی راه حل

Aspose.PDF XLS Converter برای .NET به شما اجازه می دهد:

  • تبدیل یک یا چند فایل PDF به فایل های اکسل (XLSX، XLS، CSV، ODS، XML)
  • کنترل ساختار ورق کار و فرمت
  • یکپارچه سازی صاف با پروژه های C#/NET برای اتوماسیون مقیاس پذیر

پیش شرط

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر
  • Aspose.PDF برای .NET نصب شده از طریق NuGet
PM> Install-Package Aspose.PDF

پیاده سازی گام به گام

مرحله اول: مکان های نامی مورد نیاز

using Aspose.Pdf.Plugins;
using System.IO;

مرحله 2: تبدیل یک PDF به XLSX

var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";

// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);

استفاده از موارد و برنامه ها (با تغییرات کد)

1. صادرات به CSV، XLS، ODS یا XML

مشخص کردن فرمت خروجی مورد نظر با استفاده از Format املاک:

options.Format = PdfToXlsOptions.ExcelFormat.CSV;  // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS;  // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

See PdfToXlsOptions.Excelفورمات برای تمام فرمت های پشتیبانی شده.

2. Batch تبدیل PDF های چندگانه به Excel

string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
    var outXlsx = Path.ChangeExtension(file, ".xlsx");
    var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
    opts.AddInput(new FileDataSource(file));
    opts.AddOutput(new FileDataSource(outXlsx));
    using (var converter = new PdfXls())
    {
        converter.Process(opts);
    }
}

3. تعداد کارگاه ها را به حداقل برسانید

به طور پیش فرض، هر صفحه PDF تبدیل به یک صفحه کار جدید اکسل می شود.برای ذخیره تمام محتوا در یک ورق کار:

options.MinimizeTheNumberOfWorksheets = true;

4. در ابتدا یک ستون سفید را وارد کنید

برای برخی سناریوهای واردات داده، ممکن است بخواهید یک ستون سفید را به عنوان ستون اول اضافه کنید:

options.InsertBlankColumnAtFirst = true;

بهترین روش ها و راهنمایی ها

  • پیش نمایش خروجی برای تأیید طرح جدول و یکپارچگی داده ها، به ویژه هنگام استفاده از گزینه های طرح پیشرفته.
  • برای اسناد بزرگ، از پردازش بسته برای اتوماسیون تبدیل عمده به طور موثر استفاده کنید.
  • هنگامی که به CSV تبدیل می شود، دلیمیترها و رمزگذاری را برای سازگاری با جریان پایین بررسی کنید.
  • برای PDF های بسیار ساختار یافته یا اسکن شده، اسناد پیش پردازش برای بهترین نتایج.

نمونه کامل اجرای

using Aspose.Pdf.Plugins;
using System;
using System.IO;

class Program
{
    static void Main()
    {
        var inputPath = @"C:\Samples\sample.pdf";
        var outputPath = @"C:\Samples\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

نتیجه گیری

Aspose.PDF XLS Converter برای .NET امکان اتوماسیون سریع، قوی و انعطاف پذیر PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) در پروژه های C# را فراهم می کند.Data from PDFs, streamline analytics, and integrate spreadsheet workflows – all with a simple, high-performance API.

پرسش های مکرر

**Q: چه فرمت هایی را می توانم به غیر از XLSX صادر کنم?**A: فرمت های پشتیبانی شده شامل XLSX، XLSM، CSV، ODS و Excel 2003 XML است Format املاک را انتخاب کنید.

**Q: چگونه می توانم تمام محتوای PDF را در یک صفحه کار ذخیره کنم?**A : تنظیمات MinimizeTheNumberOfWorksheets = true بر روی شما PdfToXlsOptions.

**Q: کجا می توانم نمونه های بیشتری پیدا کنم یا پشتیبانی دریافت کنم?**A: به اسناد رسمی Aspose.PDF، API Reference یا پشتیبانی تماس برای سناریوهای پیشرفته مراجعه کنید.

 فارسی