Як витягти всі зображення з кількох PDF-файлів в .NET

Як витягти всі зображення з кількох PDF-файлів в .NET

Витяг зображень з одного ПДФ Цей посібник показує, як автоматизувати екстракцію зображень великої кількості з кількох PDF-файлів за допомогою Aspose.PDF.ImageExtractor Plugin для .NET.

Батч обробка робочого потоку

  • Організуйте свій вхід: Помістіть всі джерельні PDF-файли в одну папку (наприклад., /Assets/InputPDFs).
  • Дизайн вихідних папок: Оптимічно, створюйте підфолли для кожного PDF або збирайте всі зображення в одному каталозі.
  • Налаштуйте батальйонний скрипт: Використовуйте Aspose.PDF.Plugin’s ImageExtractor Завантажити кожен файл для обробки.

Проходження через файли (код прикладу)

using Aspose.Pdf.Plugins;
using System.IO;

string inputDir = @"C:\Assets\InputPDFs";
string outputBaseDir = @"C:\Assets\ExtractedImages";

string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");

foreach (var pdfFile in pdfFiles)
{
    // Optionally create a unique folder for each PDF
    string pdfName = Path.GetFileNameWithoutExtension(pdfFile);
    string imageOutputDir = Path.Combine(outputBaseDir, pdfName);
    Directory.CreateDirectory(imageOutputDir);

    // Configure extractor
    var extractor = new ImageExtractor();
    var options = new ImageExtractorOptions();
    options.AddInput(new FileDataSource(pdfFile));

    // Process extraction
    var resultContainer = extractor.Process(options);
    int imageIndex = 0;
    foreach (var imageResult in resultContainer.ResultCollection)
    {
        string imgPath = Path.Combine(imageOutputDir, $"img_{++imageIndex}.png");
        File.WriteAllBytes(imgPath, imageResult.ToFile());
    }
    Console.WriteLine($"Extracted {imageIndex} images from {pdfName}");
}

Управління результатами та передові поради

  • Файл Організація: Використовуйте унікальні папки для кожного PDF, або ім’я зображень за джерелом імені файлу і сторінки.
  • Скалабільність: Розділіть вхідні файли на комплекти для паралельної обробки, якщо вони працюють 100 або 1000 років PDF-файлів.
  • Формати: За замовчуванням, витягнуті зображення зберігаються у рідному форматі (наприклад, PNG, JPEG.
  • Зареєструватися: Зберігати записи для оброблених PDF / зображень для аудиту та відстеження помилок.

Використання випадків

  • Велика кількість цифрових архівів/міграції зображень
  • Автоматична графічна екстракція активів для публікації або веб-сайту
  • Юридичні або юридичні докази підготовки з збору документів

Часто задавані запитання

**Q: Як я можу зберегти зображення в персоналізованих папках або використовувати персонализовані назви?**Відповідь: Використовуйте прізвище файлу PDF (без розширення) для створення підподілок і індексувати зображення за ПДФ, як показано вище.

**Q: Чи можу я обробляти сотні або тисячі PDF-файлів в одному комплекті?**Відповідь: Так! для дуже великих робочих місць, розрізати свій вхід на менші штуки і працювати паралельно для оптимальної швидкості.

**Q: Чи витягнуті всі типи зображень (JPEG, PNG і т.д.)?**Відповідь: Так — екстрактор зберігає оригінальні формати, якщо після процесу/конверту після видобутку.

Про поради: Після екстракції використовуйте Оптимізатор з метою зменшення запасних відбитків або Розділювач Використання PDF-файлів перед вилученням.

 Українська