C#에서 Aspose.Words를 사용하여 Word 문서 읽는 방법

C#에서 Aspose.Words를 사용하여 Word 문서 읽는 방법

C#에서 Word 문서를 읽는 것은 Aspose.Words 라이브러리를 사용하면 간단할 수 있습니다. 이 튜토리얼에서는 환경 구성 방법, Word 파일 읽기를 위한 단계별 절차 및 실행 가능한 코드 예제를 제공합니다. DOCX 또는 DOC와 같은 다양한 형식을 읽고 Word 문서 내의 다양한 요소에 접근하는 방법을 배우게 됩니다.

Word 문서 읽기의 이점

  1. 문서 요소 접근:
    • 단락, 표 및 텍스트의 흐름을 추출하고 조작합니다.
  2. 쉬운 통합:
    • C# 애플리케이션에 Word 문서 읽기를 원활하게 통합합니다.
  3. 다재다능성:
    • 다양한 Word 형식을 손쉽게 처리합니다.

전제 조건: Word 문서 읽기를 위한 준비

  1. Visual Studio 또는 기타 .NET IDE가 설치되어 있는지 확인합니다.
  2. NuGet 패키지 관리자를 통해 Aspose.Words 라이브러리를 설치합니다.
  3. 튜토리얼에 필요한 코드 파일을 포함하도록 프로젝트 구조를 계획합니다.

Word 문서를 읽기 위한 단계별 가이드

1단계: 환경 구성

.NET 프로젝트에서 NuGet 패키지 관리자를 사용하여 Aspose.Words 라이브러리를 추가합니다.

실행할 명령: Install-Package Aspose.Words


2단계: 입력 DOCX 파일 로드

Document 클래스를 인스턴스화하고 DOCX 파일을 로드합니다.

using Aspose.Words;

Document doc = new Document("input.docx");

3단계: 모든 단락 노드 가져오기

문서에서 Paragraph 유형의 모든 노드를 검색합니다.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

4단계: 모든 Run 노드 가져오기

문서에서 Run 유형의 모든 노드를 검색합니다.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

C#에서 Word 파일 읽기를 위한 예제 코드

위의 모든 단계를 결합한 전체 코드는 다음과 같습니다.

// 읽을 원본 Word 파일 로드
Document doc = new Document("input.docx");

// 문서의 모든 단락을 읽고 내용을 표시합니다
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// 문서의 모든 Run을 읽고 스타일과 텍스트를 표시합니다
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

결론

이 튜토리얼에서는 Aspose.Words를 사용하여 C#에서 Word 문서를 읽는 방법, 구성 및 코드 예제를 배웠습니다. 이 지식을 통해 Word 파일 내의 다양한 요소에 접근할 수 있어 필요에 따라 콘텐츠를 처리하거나 표시하는 것이 더 쉬워집니다. 추가 탐색을 위해 Word 문서를 HTML 또는 기타 형식으로 변환하는 추가 리소스를 참조할 수 있습니다.

 한국어