So entfernen Sie eine leere Seite in Word mit C#

So entfernen Sie eine leere Seite in Word mit C#

Dieser schnelle Tutorial erklärt, wie man weiße Seiten aus Word-Dokumenten (DOCX, DOC, etc.) mit C# entfernt. Der Prozess beinhaltet das Laden einer Word-Datei, die Analyse einzelner Seiten, die Identifizierung leer Seiten und schließlich ein neues Dokument ohne die weißen Seiten zu erstellen.

Vorteile der Entfernung von weißen Seiten in Word-Dokumenten

  • Cleaner Document:- Verbessert die Lesbarkeit und Professionalität.

  • Reduzierte Dateigröße:- Effiziente Speicherung durch die Beseitigung unnötiger Seiten.

  • Automatisierungsfähigkeit:- Ideal für die automatische Reinigung großer Dokumente.

Voraussetzungen: Umwelt vorbereiten

  • Visual Studio oder andere .NET IDE.
  • Aspose.Words wird über NuGet Package Manager hinzugefügt.

Schritt für Schritt Guide zur Entfernung schwarzer Seiten in Word mit C#

Schritt 1: Konfigurieren der Umwelt

Installieren Sie die Aspose.Words-Bibliothek über den NuGet-Paketmanager.

Install-Package Aspose.Words

Schritt 2: Laden Sie das Wortdokument herunter

Laden Sie Ihre ursprüngliche Word-Datei mit dem Dokumentklasse-Objekt herunter.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Schritt 3: Entfernen Sie jede Seite separat

Laufen Sie durch jede Seite und extrahieren Sie jede Seite in ein separates Dokument für die Analyse.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

Schritt 4: Analyse einzelner Dokumente

berprüfen Sie, ob das einseitige Dokument Text oder Formen enthält.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Schritt 5: Bewahren Sie die Liste der nicht leeren Seiten

Verfolgen Sie die Seitenzahlen, die Inhalte enthalten.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

Schritt 6: Hinzufügen von nicht leeren Seiten zu einem neuen Dokument

Erstellen Sie ein neues Dokument und fügen Sie nur nicht leere Seiten mit der verfolgten Liste hinzu.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Schritt 7: Speichern Sie das geänderte Dokument

Speichern Sie das neue Dokument mit weißen Seiten entfernt.

finalDoc.Save(@"cleaned.docx");

Vollständiges Code-Exempel, um weiße Seiten in Word mit C# zu löschen#

Im Folgenden ist das vollständige exekutive Code Beispiel, das die oben genannten Schritte zeigt:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

Schlussfolgerungen

Dieser Artikel erklärte, wie Sie leere Seiten in Word-Dateien mit Hilfe von C# entfernen. Durch die folgenden Schritte können Sie leere Seiten programmatisch erkennen und entfernen, was zu einem sauberen Dokument führt.

 Deutsch