Como Remover Página em Branco no Word Usando C#

Como Remover Página em Branco no Word Usando C#

Este tutorial rápido explica como remover páginas brancas de documentos do Word (DOCX, DOC, etc.) usando C#. O processo envolve carregar um arquivo do Word, analisar páginas individuais, identificar páginas vazias, e finalmente criar um novo documento sem as páginas brancas.

Benefícios da remoção de páginas brancas em documentos do Word

  • Documento de limpeza:- Melhora a leitura e o profissionalismo.

  • Dimensão reduzida do arquivo:- armazenamento eficiente eliminando páginas desnecessárias.

  • Capacidade de automação:- Ideal para limpar documentos grandes automaticamente.

Título: Preparando o Meio Ambiente

  • Visual Studio ou outro .NET IDE.
  • Aspose.Words foi adicionado através do NuGet Package Manager.

Guia passo a passo para remover páginas brancas no Word usando C#

Passo 1: Configurar um ambiente

Instale a biblioteca Aspose.Words através do gerenciador de pacotes NuGet.

Install-Package Aspose.Words

Passo 2: Carregar o documento da palavra

Carregue o seu arquivo Word original usando o objeto da classe Document.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Passo 3: Extrair cada página separadamente

Passe por cada página e extraa cada página em um documento separado para análise.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

Passo 4: Análise de documentos de página única

Verifique se o documento de uma página contém texto ou formas.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Passo 5: Mantenha a lista de páginas não vazias

Siga os números de páginas que contêm conteúdo.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

Passo 6: Adicionar páginas não vazias a um novo documento

Crie um novo documento e adicione apenas páginas não vazias usando a lista rastreada.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Passo 7: Salve o documento alterado

Salve o novo documento com páginas brancas removidas.

finalDoc.Save(@"cleaned.docx");

Exemplo de código completo para remover páginas brancas no Word usando C#

Abaixo está o exemplo completo de código executável que demonstra os passos acima:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

Conclusão

Este artigo explicou como remover páginas vazias em arquivos do Word usando C#. Ao seguir os passos fornecidos, você pode detectar programadamente páginas vazias e removê-las, resultando em um documento mais limpo.

 Português