# C#を使用してWordの空白ページを削除する方法

# C#を使用してWordの空白ページを削除する方法

この迅速なチュートリアルは、C#を使用してWordドキュメント(DOCX、DOCなど)から空のページを削除する方法を説明します。このプロセスは、Wordファイルをアップロードし、個々のページを分析し、空のページを特定し、最終的に空のページなしで新しいドキュメントを作成します。

Word ドキュメントで白いページを削除する利点

  • クリーン・ドキュメント:- 読みやすさとプロフェッショナリズムを向上させる。

  • ファイルサイズの削減:- 不必要なページを削除することによって効率的な保存

  • 自動化能力:- 大型ドキュメントを自動的に掃除するのに最適です。

原題: Preparing the Environment

  • Visual Studio またはその他の .NET IDE です。
  • Aspose.Words は NuGet パッケージマネージャーを通じて追加されました。

ステップ・ステップ・ガイド C# を使用して Word で白いページを削除する

ステップ1:環境設定

パッケージマネージャー NuGet を通じて Aspose.Words ライブラリをインストールします。

Install-Package Aspose.Words

ステップ2:Word Documentをアップロードする

ドキュメントクラスオブジェクトを使用してオリジナルのWordファイルをアップロードします。

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ステップ3:各ページを別々に抽出する

各ページを通過し、各ページを分析のための別々のドキュメントに抽出します。

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

ステップ4:単ページドキュメントの分析

単ページドキュメントにテキストまたは形式が含まれているかどうかを確認します。

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

ステップ5:空っぽのページのリストを維持する

コンテンツを含むページ数を追跡します。

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

ステップ6:新しい文書に非空のページを追加する

新しいドキュメントを作成し、追跡リストを使用して非空のページのみを追加します。

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

ステップ7:修正された文書を保存

新しい文書を保存し、白いページが削除されます。

finalDoc.Save(@"cleaned.docx");

C# を使用して Word で白いページを削除するための完全なコード 例

以下は、上記のステップを示す実行可能なコードの完全な例です:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

結論

この記事では、C#を使用してWordファイルで空のページを削除する方法を説明しました. 提供されたステップに従って、空のページをプログラム的に検出し、それらを削除することができ、より清潔なドキュメントとなります. より多くのWord ドキュメント操作のための Aspose.Words をさらに検索することができます。

 日本語