Jak odstranit prázdnou stránku ve Wordu pomocí C#

Jak odstranit prázdnou stránku ve Wordu pomocí C#

Tento rychlý tutoriál vysvětluje, jak odstranit prázdné stránky z dokumentů Word (DOCX, DOC atd.) pomocí C#. Proces zahrnuje načtení souboru Word, analýzu jednotlivých stránek, identifikaci prázdných stránek a nakonec vytvoření nového dokumentu bez prázdných stránek.

Výhody odstranění prázdných stránek v dokumentech Word

  1. Čistší dokument:
    • Zlepšuje čitelnost a profesionalitu.
  2. Snížená velikost souboru:
    • Efektivní úložiště odstraněním zbytečných stránek.
  3. Možnost automatizace:
    • Ideální pro automatické čištění velkých dokumentů.

Požadavky: Příprava prostředí

  1. Visual Studio nebo jiný .NET IDE.
  2. Aspose.Words přidané prostřednictvím správce balíčků NuGet.

Podrobný návod k odstranění prázdných stránek v dokumentu Word pomocí C#

Krok 1: Konfigurace prostředí

Nainstalujte knihovnu Aspose.Words prostřednictvím správce balíčků NuGet.

Install-Package Aspose.Words

Krok 2: Načtení dokumentu Word

Načtěte svůj původní soubor Word pomocí objektu třídy Document.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Krok 3: Extrakce každé stránky zvlášť

Projděte každou stránku a extrahujte každou stránku do samostatného dokumentu pro analýzu.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyzujte singlePageDoc v dalších krocích
}

Krok 4: Analýza dokumentů s jednou stránkou

Zkontrolujte, zda dokument s jednou stránkou obsahuje text nebo tvary.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Krok 5: Udržování seznamu neprázdných stránek

Sledujte čísla stránek obsahujících obsah.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i je index stránky v cyklu

Krok 6: Přidání neprázdných stránek do nového dokumentu

Vytvořte nový dokument a přidejte pouze neprázdné stránky pomocí sledovaného seznamu.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Krok 7: Uložení upraveného dokumentu

Uložte nový dokument s odstraněnými prázdnými stránkami.

finalDoc.Save(@"cleaned.docx");

Kompletní příklad kódu pro odstranění prázdných stránek v dokumentu Word pomocí C#

Níže je kompletní spustitelný příklad kódu, který demonstruje výše uvedené kroky:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Prázdné stránky byly úspěšně odstraněny.");

Závěr

Tento článek vysvětlil, jak odstranit prázdné stránky v souborech Word pomocí C#. Následováním poskytnutých kroků můžete programově detekovat prázdné stránky a odstranit je, což povede k čistšímu dokumentu. Můžete dále prozkoumat Aspose.Words pro další úkoly manipulace s dokumenty Word.

 Čeština