Jak usunąć pustą stronę w Wordzie za pomocą C#

Jak usunąć pustą stronę w Wordzie za pomocą C#

Ten szybki samouczek wyjaśnia, jak usunąć puste strony z dokumentów Word (DOCX, DOC itp.) przy użyciu C#. Proces obejmuje załadowanie pliku Word, analizowanie poszczególnych stron, identyfikowanie pustych stron, a na koniec utworzenie nowego dokumentu bez pustych stron.

Korzyści z usuwania pustych stron w dokumentach Word

  1. Czystszy dokument:
    • Poprawia czytelność i profesjonalizm.
  2. Zmniejszenie rozmiaru pliku:
    • Efektywne przechowywanie poprzez eliminację niepotrzebnych stron.
  3. Możliwość automatyzacji:
    • Idealne do automatycznego czyszczenia dużych dokumentów.

Wymagania wstępne: Przygotowanie środowiska

  1. Visual Studio lub inne IDE .NET.
  2. Aspose.Words dodane przez Menedżera Pakietów NuGet.

Przewodnik krok po kroku, jak usunąć puste strony w Wordzie przy użyciu C#

Krok 1: Skonfiguruj środowisko

Zainstaluj bibliotekę Aspose.Words przez menedżera pakietów NuGet.

Install-Package Aspose.Words

Krok 2: Załaduj dokument Word

Załaduj swój oryginalny plik Word za pomocą obiektu klasy Document.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Krok 3: Wyodrębnij każdą stronę osobno

Przejdź przez każdą stronę i wyodrębnij każdą stronę do osobnego dokumentu w celu analizy.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analizuj singlePageDoc w następnych krokach
}

Krok 4: Analizuj dokumenty jednostronicowe

Sprawdź, czy dokument jednostronicowy zawiera tekst lub kształty.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Krok 5: Utrzymaj listę stron niepustych

Śledź numery stron zawierających treść.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i to indeks strony w pętli

Krok 6: Dołącz niepuste strony do nowego dokumentu

Utwórz nowy dokument i dołącz tylko niepuste strony, korzystając ze śledzonej listy.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Krok 7: Zapisz zmodyfikowany dokument

Zapisz nowy dokument z usuniętymi pustymi stronami.

finalDoc.Save(@"cleaned.docx");

Pełny przykład kodu do usuwania pustych stron w Wordzie przy użyciu C#

Poniżej znajduje się kompletny przykład kodu wykonawczego ilustrujący powyższe kroki:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Puste strony zostały pomyślnie usunięte.");

Podsumowanie

Artykuł ten wyjaśnił, jak usunąć puste strony w plikach Word przy użyciu C#. Postępując zgodnie z podanymi krokami, możesz programowo wykrywać puste strony i je usunąć, co skutkuje czystszym dokumentem. Możesz również zbadać Aspose.Words w celu wykonania innych zadań związanych z manipulacją dokumentami Word.

 Polski