Hvordan fjerne hvit side i Word ved hjelp av C#

Hvordan fjerne hvit side i Word ved hjelp av C#

Denne raske veiledningen forklarer hvordan du fjerner tomme sider fra Word-dokumenter (DOCX, DOC, etc.) ved hjelp av C#. Prosessen innebærer å laste opp en Word fil, analysere individuelle sider, identifisere tomte sider og til slutt lage et nytt dokument uten tommene sider.

Fordelene med å fjerne hvite sider i Word-dokumenter

  • • «Cleaner Document»- Forbedrer lesbarhet og profesjonalitet.

  • ** Redusert filstørrelse** :- Effektiv lagring ved å eliminere unødvendige sider.

  • Automatiseringskapasitet- Ideelt for å rengjøre store dokumenter automatisk.

Forutsetninger: Å forberede miljøet

  • Visual Studio eller andre .NET IDE.
  • Aspose.Words er lagt til via NuGet Package Manager.

Step-by-step guide for å fjerne hvite sider i Word ved hjelp av C#

Steg 1: Konfigurere miljøet

Installere Aspose.Words-biblioteket gjennom NuGet-pakkeadministratoren.

Install-Package Aspose.Words

Steg 2: Last ned ordet dokument

Last ned din opprinnelige Word-fil ved hjelp av dokumentklasseobjektet.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Trinn 3: Utveksle hver side separat

Gå gjennom hver side og utveksle hvert nettsted til et separat dokument for analyse.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

Steg 4: Analyse enkeltsider dokumenter

Sjekk om dokumentet på én side inneholder tekst eller former.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Steg 5: Oppbevar ikke tomme sider

Hold sporing av sidene som inneholder innhold.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

Steg 6: Legg ikke tomme sider til nytt dokument

Skap et nytt dokument og legg til bare uendelige sider ved hjelp av den sporede listen.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Steg 7: Lagre modifiserte dokumenter

Lagre det nye dokumentet med hvite sider fjernet.

finalDoc.Save(@"cleaned.docx");

Komplett kodeeksempel for å slette hvite sider i Word ved hjelp av C#

Nedenfor er det komplette eksemplet på utførbar kode som viser de ovennevnte trinnene:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

Conclusion

Denne artikkelen forklarte hvordan du fjerner tomme sider i Word-filer ved hjelp av C#. Ved å følge de foreskrevne trinnene, kan du programmatisk oppdage tomte sider og fjerne dem, noe som resulterer i en renere dokument.

 Norsk