Hogyan lehet eltávolítani a Fehér oldal a Word használatával C#

Hogyan lehet eltávolítani a Fehér oldal a Word használatával C#

Ez a gyors útmutató elmagyarázza, hogyan lehet eltávolítani a tiszta oldalakat a Word dokumentumokból (DOCX, DOC, stb.) a C# használatával.A folyamat magában foglalja a Word fájl feltöltését, az egyes oldalak elemzését, az üres oldalak azonosítását, és végül új dokumentumot hoz létre a tiszta oldalak nélkül.

A fehér oldalak eltávolításának előnyei a Word dokumentumokban

  • Tisztító dokumentumok:- Javítja az olvashatóságot és a professzionalizmust.

  • Rövidített fájl mérete:- Hatékony tárolás a felesleges oldalak kiküszöbölésével.

  • Automatizálási kapacitás:- Ideális a nagy dokumentumok automatikus tisztításához.

Előfeltételek: a környezet előkészítése

  • Visual Studio vagy más .NET IDE.
  • Az Aspose.Words hozzáadása a NuGet Package Manager segítségével.

Lépésről lépésre útmutató a Fehér oldalak eltávolítására a C# használatával

1. lépés: Környezet létrehozása

Telepítse az Aspose.Words könyvtárat a NuGet csomagkezelő segítségével.

Install-Package Aspose.Words

2. lépés: Töltse le a Word dokumentumot

Töltse le az eredeti Word fájlt a Dokumentum osztályú objektum használatával.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

3. lépés: Minden oldal elkülönítve

Menj át minden oldalt, és húzza ki minden oldalt egy külön Dokumentum elemzéséhez.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

4. lépés: Egyoldalú dokumentumok elemzése

Ellenőrizze, hogy az egyoldalú dokumentum tartalmaz-e szöveget vagy formákat.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

5. lépés: Tartsa az üres oldalak listáját

Nyomon kövesse a tartalmat tartalmazó oldalszámokat.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

6. lépés: A nem üres oldalak hozzáadása az új dokumentumhoz

Hozzon létre egy új dokumentumot, és csak a nyomon követett listát használva a nem üres oldalakat tartalmazza.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

7. lépés: A módosított dokumentum mentése

Mentse az új dokumentumot a fehér oldalak eltávolításával.

finalDoc.Save(@"cleaned.docx");

Teljes kódmintája a Fehér oldalak eltávolításához a C# használatával

Az alábbiakban a teljes végrehajtható kód példája mutatja a fenti lépéseket:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

következtetések

Ez a cikk megmagyarázta, hogyan lehet eltávolítani a tiszta oldalakat a Word fájlok használata C#. Azáltal, hogy kövesse a megadott lépéseket, akkor programozottan észleli az üres oldalakat, és távolítsa el őket, ami egy tisztább dokumentum.

 Magyar