Como automatizar batch divisão de PDFs em .NET

Como automatizar batch divisão de PDFs em .NET

Gerenciamento grande PDF Arquivos ou repositórios de documentos corporativos? com o Aspose.PDF.Plugin Splitter para .NET, você pode programaticamente dividir centenas ou milhares de PDFs em páginas individuais ou ramos personalizados – perfeito para arquivos digitais, e-discovery, ou automação de fluxo de trabalho.

Batch Scripting: Divida todos os PDFs em uma pasta

using Aspose.Pdf.Plugins;
using System.IO;

string inputFolder = @"C:\Archive\PDFs";
string outputFolder = @"C:\Archive\Split";
Directory.CreateDirectory(outputFolder);

string[] pdfFiles = Directory.GetFiles(inputFolder, "*.pdf");

foreach (var pdfFile in pdfFiles)
{
    string baseName = Path.GetFileNameWithoutExtension(pdfFile);
    // Example: Determine page count (using Aspose.PDF.Document, or plugin API if available)
    int pageCount = /* Get page count for pdfFile */;
    var splitter = new Splitter();
    var splitOptions = new SplitOptions();
    splitOptions.AddInput(new FileDataSource(pdfFile));
    for (int i = 1; i <= pageCount; i++)
    {
        string outPath = Path.Combine(outputFolder, $"{baseName}_Page_{i}.pdf");
        splitOptions.AddOutput(new FileDataSource(outPath));
    }
    splitter.Process(splitOptions);
    Console.WriteLine($"Split {pdfFile} into {pageCount} pages.");
}

Dicas de desempenho e automação

  • Batch size: Não há limites de codificação rígida – processamento de 100s ou 1000s de arquivos, mas use tamanhos de folha razoáveis (por exemplo, batches de 500-1000) para a memória e I/O estabilidade.
  • Paralelismo: Para uma passagem mais rápida, use tarefas multi-trading ou async em hardware moderno (teste para discos/CPU).
  • Nome de arquivo: Use nomes de base e números de página ou seção para uma organização clara e rastreabilidade.
  • Logging: Escreva logs para cada arquivo/página processado – ajuda na recuperação de erros e auditoria.

Casos de Uso

  • Arquivo Digital: Separa batches de documentos escaneados para indicação mais fácil
  • E-Discovery: Extracção em massa de páginas relevantes para revisão legal
  • Enterprise IT: Distribuir apenas páginas relevantes para equipes ou clientes

Perguntas frequentes

**Q: Existe algum tamanho de batch ou limite de contagem de arquivos?**A: Não – o plugin gerencia batches muito grandes. para casos extremos, romper a entrada em subfolders ou executar vários trabalhos de batch.

**Q: Como posso automatizar o nomeamento personalizado para arquivos divididos?**A: Use o nome de base do PDF original plus a suffix (_Page_#, ou nome da seção) como no exemplo acima.

**Q: Posso dividir PDFs criptografados ou protegidos por senha?**A: Sim – forneça a senha nas opções de plug-in quando necessário.

Pro Sugestão: Combine divisão e otimização em um pacote para poupança de armazenamento, ou combine os outputos divididos de volta conforme necessário usando o plugin Merger.

 Português