Як витягти всі зображення з кількох PDF-файлів в .NET
Витяг зображень з одного ПДФ Цей посібник показує, як автоматизувати екстракцію зображень великої кількості з кількох PDF-файлів за допомогою Aspose.PDF.ImageExtractor Plugin для .NET.
Батч обробка робочого потоку
- Організуйте свій вхід: Помістіть всі джерельні PDF-файли в одну папку (наприклад.,
/Assets/InputPDFs). - Дизайн вихідних папок: Оптимічно, створюйте підфолли для кожного PDF або збирайте всі зображення в одному каталозі.
- Налаштуйте батальйонний скрипт: Використовуйте Aspose.PDF.Plugin’s
ImageExtractorЗавантажити кожен файл для обробки.
Проходження через файли (код прикладу)
using Aspose.Pdf.Plugins;
using System.IO;
string inputDir = @"C:\Assets\InputPDFs";
string outputBaseDir = @"C:\Assets\ExtractedImages";
string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");
foreach (var pdfFile in pdfFiles)
{
// Optionally create a unique folder for each PDF
string pdfName = Path.GetFileNameWithoutExtension(pdfFile);
string imageOutputDir = Path.Combine(outputBaseDir, pdfName);
Directory.CreateDirectory(imageOutputDir);
// Configure extractor
var extractor = new ImageExtractor();
var options = new ImageExtractorOptions();
options.AddInput(new FileDataSource(pdfFile));
// Process extraction
var resultContainer = extractor.Process(options);
int imageIndex = 0;
foreach (var imageResult in resultContainer.ResultCollection)
{
string imgPath = Path.Combine(imageOutputDir, $"img_{++imageIndex}.png");
File.WriteAllBytes(imgPath, imageResult.ToFile());
}
Console.WriteLine($"Extracted {imageIndex} images from {pdfName}");
}Управління результатами та передові поради
- Файл Організація: Використовуйте унікальні папки для кожного PDF, або ім’я зображень за джерелом імені файлу і сторінки.
- Скалабільність: Розділіть вхідні файли на комплекти для паралельної обробки, якщо вони працюють 100 або 1000 років PDF-файлів.
- Формати: За замовчуванням, витягнуті зображення зберігаються у рідному форматі (наприклад, PNG, JPEG.
- Зареєструватися: Зберігати записи для оброблених PDF / зображень для аудиту та відстеження помилок.
Використання випадків
- Велика кількість цифрових архівів/міграції зображень
- Автоматична графічна екстракція активів для публікації або веб-сайту
- Юридичні або юридичні докази підготовки з збору документів
Часто задавані запитання
**Q: Як я можу зберегти зображення в персоналізованих папках або використовувати персонализовані назви?**Відповідь: Використовуйте прізвище файлу PDF (без розширення) для створення підподілок і індексувати зображення за ПДФ, як показано вище.
**Q: Чи можу я обробляти сотні або тисячі PDF-файлів в одному комплекті?**Відповідь: Так! для дуже великих робочих місць, розрізати свій вхід на менші штуки і працювати паралельно для оптимальної швидкості.
**Q: Чи витягнуті всі типи зображень (JPEG, PNG і т.д.)?**Відповідь: Так — екстрактор зберігає оригінальні формати, якщо після процесу/конверту після видобутку.
Про поради: Після екстракції використовуйте Оптимізатор з метою зменшення запасних відбитків або Розділювач Використання PDF-файлів перед вилученням.