چگونه به تبدیل PDF به Excel (XLS / XLSX / CSV) در .NET
این مقاله نشان می دهد که چگونه به طور برنامه نویسی تبدیل اسناد PDF به فرمت های مایکروسافت اکسل (XLS، XLSX، CSV، و بیشتر) با استفاده از Aspose.PDF XLS Converter برای .NET. این به شما امکان باز کردن، تجزیه و تحلیل و اتوماتیک انتقال داده ها از PDF ها به صفحات برای پردازش بیشتر، گزارش و یا آرشیو.
مشکل دنیای واقعی
صادرات جدول ها یا داده های ساختار یافته از فایل های PDF به اکسل به صورت دستی کارآفرین و بدون خطا است. اتوماسیون این تبدیل برای جریان های کاری در امور مالی، گزارش، تجزیه و تحلیل و انطباق که در آن عملیات عمده PDF- به پهنای باند مورد نیاز است، ضروری است .
بررسی راه حل
Aspose.PDF XLS Converter برای .NET به شما اجازه می دهد:
- تبدیل یک یا چند فایل PDF به فایل های اکسل (XLSX، XLS، CSV، ODS، XML)
- کنترل ساختار ورق کار و فرمت
- یکپارچه سازی صاف با پروژه های C#/NET برای اتوماسیون مقیاس پذیر
پیش شرط
- Visual Studio 2019 یا بالاتر
- .NET 6.0 یا بالاتر
- Aspose.PDF برای .NET نصب شده از طریق NuGet
PM> Install-Package Aspose.PDF
پیاده سازی گام به گام
مرحله اول: مکان های نامی مورد نیاز
using Aspose.Pdf.Plugins;
using System.IO;
مرحله 2: تبدیل یک PDF به XLSX
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
// Use PdfXls (preferred) or XlsConverter – both expose the same conversion core.
var converter = new PdfXls();
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
// Perform conversion
var result = converter.Process(options);
Console.WriteLine("PDF converted to XLSX: " + outputPath);
استفاده از موارد و برنامه ها (با تغییرات کد)
1. صادرات به CSV، XLS، ODS یا XML
مشخص کردن فرمت خروجی مورد نظر با استفاده از Format
املاک :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
See PdfToXlsOptions.Excelفورمات برای تمام فرمت های پشتیبانی شده
2. Batch تبدیل PDF های چندگانه به Excel
string[] files = Directory.GetFiles(@"C:\Docs\", "*.pdf");
foreach (var file in files)
{
var outXlsx = Path.ChangeExtension(file, ".xlsx");
var opts = new PdfToXlsOptions { Format = PdfToXlsOptions.ExcelFormat.XLSX };
opts.AddInput(new FileDataSource(file));
opts.AddOutput(new FileDataSource(outXlsx));
using (var converter = new PdfXls())
{
converter.Process(opts);
}
}
3. تعداد کارگاه ها را به حداقل برسانید
به طور پیش فرض، هر صفحه PDF تبدیل به یک صفحه کار جدید اکسل می شود.برای ذخیره تمام محتوا در یک ورق کار:
options.MinimizeTheNumberOfWorksheets = true;
4. در ابتدا یک ستون سفید را وارد کنید
برای برخی سناریوهای واردات داده، ممکن است بخواهید یک ستون سفید را به عنوان ستون اول اضافه کنید:
options.InsertBlankColumnAtFirst = true;
بهترین روش ها و راهنمایی ها
- پیش نمایش خروجی برای تأیید طرح جدول و یکپارچگی داده ها، به ویژه هنگام استفاده از گزینه های طرح پیشرفته.
- برای اسناد بزرگ، از پردازش بسته برای اتوماسیون تبدیل عمده به طور موثر استفاده کنید.
- هنگامی که به CSV تبدیل می شود، دلیمیترها و رمزگذاری را برای سازگاری با جریان پایین بررسی کنید.
- برای PDF های بسیار ساختار یافته یا اسکن شده، اسناد پیش پردازش برای بهترین نتایج.
نمونه کامل اجرای
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = @"C:\Samples\sample.pdf";
var outputPath = @"C:\Samples\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
نتیجه گیری
Aspose.PDF XLS Converter برای .NET امکان اتوماسیون سریع، قوی و انعطاف پذیر PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) در پروژه های C# را فراهم می کند.Data from PDFs, streamline analytics, and integrate spreadsheet workflows – all with a simple, high-performance API.
پرسش های مکرر
**Q: چه فرمت هایی را می توانم به غیر از XLSX صادر کنم؟**A: فرمت های پشتیبانی شده شامل XLSX، XLSM، CSV، ODS و Excel 2003 XML است. Format
املاک را انتخاب کنید.
**Q: چگونه می توانم تمام محتوای PDF را در یک صفحه کار ذخیره کنم؟**A : تنظیمات MinimizeTheNumberOfWorksheets = true
بر روی شما PdfToXlsOptions
.
**Q: کجا می توانم نمونه های بیشتری پیدا کنم یا پشتیبانی دریافت کنم؟**A: به اسناد رسمی Aspose.PDF، API Reference یا پشتیبانی تماس برای سناریوهای پیشرفته مراجعه کنید.