.NET में कई पीडीएफ से सभी छवियों को कैसे बैच करें
एक ही पीडीएफ से छवियों को निकालना आसान है-लेकिन सैकड़ों या हजारों के बारे में क्या है? इस गाइड में दिखाया गया है कि कैसे .NET के लिए Aspose.PDF.ImageExtractor Plugin का उपयोग करके बड़े पैमाने पर छवि निष्कर्षण को स्वचालित करना है. मीडिया संग्रह, आईटी संपत्ति प्रसंस्करण, या डिजिटल सामग्री रीपोरपॉजिंग के रूप में सही।
बैच प्रसंस्करण कार्यप्रवाह
- अपने इनपुट को व्यवस्थित करें: सभी स्रोत पीडीएफ फ़ाइलों को एक ही फ़ोल्डर में रखें (उदाहरण के लिए,
/Assets/InputPDFs
). - आउटपुट फ़ोल्डर डिजाइन करें: वैकल्पिक रूप से, प्रत्येक पीडीएफ के लिए उपफ़ॉल्डर्स बनाएं या सभी छवियों को एक ही निर्देशिका में इकट्ठा करें।
- ** बैच स्क्रिप्ट सेटअप करें:** Aspose.PDF का उपयोग करें.Plugin’s
ImageExtractor
प्रत्येक फ़ाइल को संसाधित करने के लिए एक लूप में।
फ़ाइलों के माध्यम से चलना (कोड उदाहरण)
using Aspose.Pdf.Plugins;
using System.IO;
string inputDir = @"C:\Assets\InputPDFs";
string outputBaseDir = @"C:\Assets\ExtractedImages";
string[] pdfFiles = Directory.GetFiles(inputDir, "*.pdf");
foreach (var pdfFile in pdfFiles)
{
// Optionally create a unique folder for each PDF
string pdfName = Path.GetFileNameWithoutExtension(pdfFile);
string imageOutputDir = Path.Combine(outputBaseDir, pdfName);
Directory.CreateDirectory(imageOutputDir);
// Configure extractor
var extractor = new ImageExtractor();
var options = new ImageExtractorOptions();
options.AddInput(new FileDataSource(pdfFile));
// Process extraction
var resultContainer = extractor.Process(options);
int imageIndex = 0;
foreach (var imageResult in resultContainer.ResultCollection)
{
string imgPath = Path.Combine(imageOutputDir, $"img_{++imageIndex}.png");
File.WriteAllBytes(imgPath, imageResult.ToFile());
}
Console.WriteLine($"Extracted {imageIndex} images from {pdfName}");
}
आउटपुट प्रबंधन और उन्नत टिप्स
- ** फ़ाइल संगठन:** प्रत्येक पीडीएफ के लिए अद्वितीय फ़ोल्डर का उपयोग करें, या फ़िल्टर नाम और पृष्ठ के आधार पर नाम छवियों।
- ** स्केलिंग:** इनपुट फ़ाइलों को समानांतर प्रसंस्करण के लिए बैच में विभाजित करें यदि 100 या 1000 पीडीएफ का प्रबंधन किया जाता है।
- ** स्वरूप:** डिफ़ॉल्ट रूप से, निकाले गए छवियों को उनके मूल प्रारूप (उदाहरण के लिए, PNG, JPEG) में संग्रहीत किया जाता है।
- ** लॉगिंग:** ऑडिट और त्रुटि ट्रैकिंग के लिए प्रसंस्करण किए गए पीडीएफ / छवियों के रिकॉर्ड रखें।
मामलों का उपयोग
- बड़े पैमाने पर डिजिटल संग्रह / छवि प्रवास
- प्रकाशन या वेब के लिए स्वचालित ग्राफिक संपत्ति निष्कर्षण
- दस्तावेजों के संग्रह से कानूनी या व्यावहारिक सबूत तैयार करना
अक्सर पूछे जाने वाले प्रश्न
**Q: मैं कस्टम फ़ोल्डरों में छवियों को कैसे सहेज सकता हूं या अनुकूल नामकरण का उपयोग कर सकता हूँ?**ए: PDF फ़ाइल नाम का उपयोग (एक्सटेंशन के बिना) subfolders बनाने के लिए, और PDF द्वारा छवियों को सूचकांक, जैसा कि ऊपर दिखाया गया है।
** Q: क्या मैं एक बैच में सैकड़ों या हजारों पीडीएफ को संसाधित कर सकता हूं?**ए: हाँ! बहुत बड़ी नौकरियों के लिए, अपने इनपुट को छोटे बैट्स में तोड़ दें और इष्टतम गति के साथ समानांतर चलाएं।
** Q: क्या सभी छवि प्रकार (JPEG, PNG, आदि) निकाले गए हैं?**A: हाँ - निष्कर्षक मूल प्रारूपों को बनाए रखता है, जब तक कि आप निष्पादन के बाद प्रक्रिया / रूपांतरण नहीं करते हैं।
प्रो टिप: निकालने के बाद, का उपयोग करें Optimizer भंडारण निशान को कम करने के लिए, या Splitter पीडीएफ को निकालने से पहले संसाधित करें।