# Jak usunąć pustą stronę w Wordzie za pomocą C#

# Jak usunąć pustą stronę w Wordzie za pomocą C#

Ten szybki tutorial wyjaśnia, jak usunąć białe strony z dokumentów Word (DOCX, DOC, itp.) za pomocą C#. Proces obejmuje pobieranie pliku Word, analizowanie poszczególnych stron, identyfikację pustych stron i ostatecznie tworzenie nowego dokumentu bez białych stron.

Korzyści z usunięcia białych stron w dokumentach Word

  • Cleaner Document:- Poprawa czytelności i profesjonalizmu.

  • Zredukowany rozmiar pliku:- Efektywne przechowywanie poprzez usuwanie niepotrzebnych stron.

  • Możliwość automatyzacji:- Idealny do automatycznego czyszczenia dużych dokumentów.

Wymagania: przygotowanie środowiska

  • Visual Studio lub inne .NET IDE.
  • Aspose.Words dodano za pośrednictwem NuGet Package Manager.

Krok po kroku Przewodnik po usunięciu czarnych stron w słowach za pomocą C#

Krok 1: Konfiguracja środowiska

Zainstaluj bibliotekę Aspose.Words za pośrednictwem menedżera pakietów NuGet.

Install-Package Aspose.Words

Krok 2: Pobierz dokument słowny

Pobierz oryginalny plik Word za pomocą obiektu klasy dokumentu.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Krok 3: Wyciągnij każdą stronę oddzielnie

Przejdź przez każdą stronę i wyciągnij każdą stronę do oddzielnego dokumentu do analizy.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

Krok 4: Analiza dokumentów pojedynczych stron

Sprawdź, czy dokument na jednej stronie zawiera tekst lub formy.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Krok 5: Utrzymanie listy niepustej strony

Trzymaj się numerów stron zawierających treść.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

Krok 6: Dodaj niepuste strony do nowego dokumentu

Stwórz nowy dokument i dodaj tylko niepustne strony za pomocą listy śledzonej.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Krok 7: Zapisz zmieniony dokument

Zapisz nowy dokument z usuniętymi stronami.

finalDoc.Save(@"cleaned.docx");

Pełny przykład kodu, aby usunąć białe strony w słowach za pomocą C#

Poniżej znajduje się kompletny przykład wykonawczego kodu, który pokazuje powyższe kroki:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

konkluzja

W tym artykule wyjaśniono, jak usunąć puste strony w plikach Word za pomocą C#. Postępując zgodnie z podanymi krokami, można programowo wykryć puste strony i je usunąć, co prowadzi do czystszego dokumentu.

 Polski