C#를 사용하여 Word에서 빈 페이지 제거하는 방법

C#를 사용하여 Word에서 빈 페이지 제거하는 방법

이 빠른 튜토리얼에서는 C#을 사용하여 Word 문서(DOCX, DOC 등)에서 빈 페이지를 제거하는 방법을 설명합니다. 이 과정은 Word 파일을 로드하고, 개별 페이지를 분석하며, 빈 페이지를 식별한 후, 빈 페이지가 없는 새 문서를 생성하는 것을 포함합니다.

Word 문서에서 빈 페이지 제거의 이점

  1. 더 깔끔한 문서:
    • 가독성과 전문성을 향상시킵니다.
  2. 파일 크기 감소:
    • 불필요한 페이지를 제거하여 효율적인 저장이 가능합니다.
  3. 자동화 기능:
    • 대규모 문서를 자동으로 정리하는 데 이상적입니다.

전제 조건: 환경 준비

  1. Visual Studio 또는 기타 .NET IDE.
  2. NuGet 패키지 관리자를 통해 추가된 Aspose.Words.

C#을 사용하여 Word에서 빈 페이지 제거하기 위한 단계별 가이드

단계 1: 환경 구성

NuGet 패키지 관리자를 통해 Aspose.Words 라이브러리를 설치합니다.

Install-Package Aspose.Words

단계 2: Word 문서 로드

Document 클래스 객체를 사용하여 원본 Word 파일을 로드합니다.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

단계 3: 각 페이지를 개별적으로 추출

각 페이지를 반복하며 분석을 위해 각 페이지를 별도의 Document로 추출합니다.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // 다음 단계에서 singlePageDoc 분석
}

단계 4: 단일 페이지 문서 분석

단일 페이지 문서에 텍스트나 도형이 포함되어 있는지 확인합니다.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

단계 5: 비어 있지 않은 페이지 목록 유지

내용이 있는 페이지 번호를 추적합니다.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i는 루프에서 페이지 인덱스

단계 6: 비어 있지 않은 페이지를 새 문서에 추가

새 문서를 생성하고 추적된 목록을 사용하여 비어 있지 않은 페이지만 추가합니다.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

단계 7: 수정된 문서 저장

빈 페이지가 제거된 새 문서를 저장합니다.

finalDoc.Save(@"cleaned.docx");

C#을 사용하여 Word에서 빈 페이지를 삭제하는 전체 코드 예제

아래는 위의 단계를 보여주는 전체 실행 가능한 코드 예제입니다:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("빈 페이지가 성공적으로 제거되었습니다.");

결론

이 문서에서는 C#을 사용하여 Word 파일에서 빈 페이지를 제거하는 방법을 설명했습니다. 제공된 단계를 따르면 빈 페이지를 프로그래밍적으로 감지하고 제거하여 더 깔끔한 문서를 얻을 수 있습니다. Aspose.Words를 추가로 탐색하여 더 많은 Word 문서 조작 작업을 수행할 수 있습니다.

 한국어