چگونه تمام تصاویر را از PDF های متعدد در .NET استخراج کنیم

چگونه تمام تصاویر را از PDF های متعدد در .NET استخراج کنیم

استخراج تصاویر از یک واحد PDF این راهنمای نشان می دهد که چگونه برای اتوماسیون استخراج تصویر در مقیاس بزرگ از چندین PDF با استفاده از Aspose.PDF.ImageExtractor Plugin برای .NET.

Batch پردازش جریان کار

  • نمایش ورودی خود را: تمام فایل های PDF منبع را در یک پوشه قرار دهید (به عنوان مثال., /Assets/InputPDFs).
  • نمایش پوشه های خروجی: به صورت اختیاری، برای هر PDF زیرپوشه ها ایجاد کنید یا تمام تصاویر را در یک دایرکتوری جمع آوری کنید.
  • نمایش اسکریپت باچ: از Aspose.PDF استفاده کنید.Plugin’s ImageExtractor در یک حلقه برای پردازش هر فایل.

فرستادن از طریق فایل ها (کد نمونه)

using Aspose.Pdf.Plugins;
using System.IO;

string inputDir = @"C:\Assets\InputPDFs";
string outputBaseDir = @"C:\Assets\ExtractedImages";

string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");

foreach (var pdfFile in pdfFiles)
{
    // Optionally create a unique folder for each PDF
    string pdfName = Path.GetFileNameWithoutExtension(pdfFile);
    string imageOutputDir = Path.Combine(outputBaseDir, pdfName);
    Directory.CreateDirectory(imageOutputDir);

    // Configure extractor
    var extractor = new ImageExtractor();
    var options = new ImageExtractorOptions();
    options.AddInput(new FileDataSource(pdfFile));

    // Process extraction
    var resultContainer = extractor.Process(options);
    int imageIndex = 0;
    foreach (var imageResult in resultContainer.ResultCollection)
    {
        string imgPath = Path.Combine(imageOutputDir, $"img_{++imageIndex}.png");
        File.WriteAllBytes(imgPath, imageResult.ToFile());
    }
    Console.WriteLine($"Extracted {imageIndex} images from {pdfName}");
}

مدیریت خروجی و راهنمایی های پیشرفته

  • سازمان فایل: از پوشه های منحصر به فرد برای هر PDF استفاده کنید یا تصاویر را با نام فایل منبع و صفحه نام دهید.
  • **تقسیم پذیری:**فایلهای ورودی را برای پردازش موازی در صورتی که 100s یا 1000s از فایل های PDF مورد استفاده قرار گیرد، به تکه ها تقسیم کنید.
  • فرمت ها: به طور پیش فرض، تصاویر استخراج شده در فرمت بومی خود ذخیره می شوند (به عنوان مثال، PNG، JPEG.
  • Logging: حفظ سوابق برای PDF های پردازش شده / تصاویر برای حسابرسی و ردیابی خطا.

موارد استفاده

  • بایگانی برچسب ها: Digital Archive/Image Migration
  • استخراج گرافیک خودکار برای انتشار و یا وب
  • آماده سازی شواهد قانونی یا قانونی از مجموعه های اسناد

پرسش های مکرر

**Q: چگونه می توانم تصاویر را به پوشه های سفارشی ذخیره کنم یا از نام گذاری سفری استفاده کنم?**A: از نام فایل PDF (بدون افزونه) برای ایجاد زیرنویس ها و فهرست تصاویر در PDF، همانطور که در بالا نشان داده شده است استفاده کنید.

**Q: آیا می توانم صدها یا هزاران فایل PDF را در یک مجموعه پردازش کنم?**A: بله!برای کارهای بسیار بزرگ، ورودی خود را به قطعات کوچکتر تقسیم کنید و برای سرعت مطلوب به صورت موازی اجرا کنید.

**Q: آیا تمام انواع تصویر (JPEG، PNG، و غیره) استخراج شده اند.)?**A: بله – استخراجگر فرمت های اصلی را حفظ می کند مگر اینکه شما پس از فرایند / تبدیل بعد از تخلیه.

پرو راهنمایی: پس از استخراج، از بهینه‌ساز برای کاهش اثر انگشت ذخیره سازی یا تقسیم کننده برای پردازش فایل های PDF قبل از استخراج.

 فارسی