Hur man tar bort en tom sida i Word med C#

Hur man tar bort en tom sida i Word med C#

Detta snabba tutorial förklarar hur man tar bort tomma sidor från Word-dokument (DOCX, DOC, etc.) med hjälp av C#. Processen involverar att ladda en Word-fil, analysera individuella sidor, identifiera tomma sidor och slutligen skapa ett nytt dokument utan de tomma sidorna.

Fördelar med att Ta Bort Tomma Sidor i Word-Dokument

  1. Renare Dokument:
    • Förbättrar läsbarheten och professionalismen.
  2. Minskad Filstorlek:
    • Effektiv lagring genom att eliminera onödiga sidor.
  3. Automatiseringskapabilitet:
    • Idealisk för att automatiskt rensa stora dokument.

Förutsättningar: Förbereda Miljön

  1. Visual Studio eller annan .NET IDE.
  2. Aspose.Words tillagt via NuGet Package Manager.

Steg-för-Steg Guide för att Ta Bort Tomma Sidor i Word med C#

Steg 1: Konfigurera Miljön

Installera Aspose.Words-biblioteket genom NuGet-paketförvaltaren.

Install-Package Aspose.Words

Steg 2: Ladda Word-Dokumentet

Ladda din ursprungliga Word-fil med hjälp av Document-klassobjektet.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Steg 3: Extrahera Varje Sida Separat

Loop igenom varje sida och extrahera varje sida till ett separat Document för analys.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analysera singlePageDoc i nästa steg
}

Steg 4: Analysera En-Sides Dokument

Kontrollera om det en-sidiga dokumentet innehåller text eller former.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Steg 5: Behålla Lista över Icke-Tomma Sidor

Håll reda på sidnummer som innehåller innehåll.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i är sidindex i loopen

Steg 6: Lägga till Icke-Tomma Sidor till Nytt Dokument

Skapa ett nytt dokument och lägg endast till icke-tomma sidor med hjälp av den spårade listan.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Steg 7: Spara Modifierat Dokument

Spara det nya dokumentet med tomma sidor borttagna.

finalDoc.Save(@"cleaned.docx");

Fullständigt Kodexempel för att Ta Bort Tomma Sidor i Word med C#

Nedan är det fullständiga körbara kodexemplet som demonstrerar ovanstående steg:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Tomma sidor borttagna framgångsrikt.");

Slutsats

Denna artikel förklarade hur man tar bort tomma sidor i Word-filer med hjälp av C#. Genom att följa de angivna stegen kan du programatiskt upptäcka tomma sidor och ta bort dem, vilket resulterar i ett renare dokument. Du kan vidare utforska Aspose.Words för fler uppgifter relaterade till manipulation av Word-dokument.

 Svenska