Како Баццх Екстрактира све слике из више ПДФ-а у .NET

Како Баццх Екстрактира све слике из више ПДФ-а у .NET

Истраживање слика из једног ПДФ Овај водич показује како аутоматизовати екстракцију великих слика из више ПДФ-а користећи Плугин Аспосе.ПдФ.ИмагеЕкстрактор за .НЕТ. Савршено за медијске архиве, обраду ИТ имовине или дигитално репродукцију садржаја.

Бацх обрада радног тока

  • Организирајте свој унос: Поставите све изворне ПДФ датотеке у једну фасциклу (на пример., /Assets/InputPDFs).
  • Дизајнирајте излазне фасцикле: Опционално, креирате подфолдове за сваки ПДФ или прикупљате све слике у једном директоријуму.
  • Подесите баццх скрипт: Користите Асписе.Пдф.плагин ImageExtractor у кругу за обраду сваког датотеке.

Пролазак кроз датотеке (код примјер)

using Aspose.Pdf.Plugins;
using System.IO;

string inputDir = @"C:\Assets\InputPDFs";
string outputBaseDir = @"C:\Assets\ExtractedImages";

string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");

foreach (var pdfFile in pdfFiles)
{
    // Optionally create a unique folder for each PDF
    string pdfName = Path.GetFileNameWithoutExtension(pdfFile);
    string imageOutputDir = Path.Combine(outputBaseDir, pdfName);
    Directory.CreateDirectory(imageOutputDir);

    // Configure extractor
    var extractor = new ImageExtractor();
    var options = new ImageExtractorOptions();
    options.AddInput(new FileDataSource(pdfFile));

    // Process extraction
    var resultContainer = extractor.Process(options);
    int imageIndex = 0;
    foreach (var imageResult in resultContainer.ResultCollection)
    {
        string imgPath = Path.Combine(imageOutputDir, $"img_{++imageIndex}.png");
        File.WriteAllBytes(imgPath, imageResult.ToFile());
    }
    Console.WriteLine($"Extracted {imageIndex} images from {pdfName}");
}

Управљање излазом и напредни савети

  • Фолдер Организација: Користите јединствене фасцикле за сваки ПДФ, или име слике по изворном датотеку и страници.
  • Скалабилност: Раздвојите улазне датотеке у пакете за паралелну обраду ако управљате 100 или 1000 година ПДФ-а.
  • Формати: По подразумевању, извучене слике се чувају у свом родном формату (на пример, ПНГ, ЈПЕГ.
  • Logging: Držite logove za obrađene PDF/slika za reviziju i praćenje grešaka.

Коришћење случајева

  • Велика дигитална архива / миграција слике
  • Аутоматска екстракција графичког имовине за објављивање или веб
  • Припрема правних или правног доказа из колекција докумената

Često postavljana pitanja

**П: Како могу да сачувам слике у прилагођеним фасциклама или користим персонализовано именовање?**А: Користите ПДФ датотеку (без проширења) да бисте креирали подфолдер, и индексирати слике по ПДВ-у, као што је приказано горе.

**П: Могу ли обрадити стотине или хиљаде ПДФ-а у једној партији?**A: Da! za veoma velike poslove, razbijte svoj ulaz u manje partije i trčite paralelno za optimalnu brzinu.

**П: Да ли су сви типови слике извучени (ЈПЕГ, ПНГ, итд.)?**Одговор: Да – екстрактор чува оригиналне формати, осим ако након процеса/конвертације након извлачења.

Про Савет: Након екстракције, користите Оптимизација да се смањи стопало за складиштење, или Splitter Обрада ПДФ-а пре екстракције.

 Српски