C#를 사용하여 워드 문서를 HTML로 변환하는 방법

C#를 사용하여 워드 문서를 HTML로 변환하는 방법

이 짧은 튜토리얼에서는 C#을 사용하여 Word 문서를 HTML로 변환하는 방법을 배웁니다. 이 변환은 .NET 프레임워크가 구성된 macOS, Linux 또는 MS Windows와 같은 모든 운영 체제에서 효율적으로 수행할 수 있습니다.

Word 문서를 HTML로 변환하는 이점

  1. 웹 호환성:
    • HTML 파일은 웹 브라우저에서 쉽게 표시될 수 있습니다.
  2. 형식 유지:
    • Word 문서의 대부분 형식이 HTML 출력에서 보존될 수 있습니다.
  3. 크로스 플랫폼 기능:
    • HTML 파일은 호환성 문제 없이 다양한 플랫폼에서 접근할 수 있습니다.

Word 문서를 HTML로 변환하는 단계별 가이드

단계 1: Aspose.Words 라이브러리 설치

변환을 용이하게 하기 위해 NuGet 패키지 관리자를 사용하여 Aspose.Words 라이브러리를 설치합니다.

Install-Package Aspose.Words

단계 2: DOCX 파일 로드

Document 클래스를 인스턴스화하여 변환할 Word 문서를 로드합니다.

Document doc = new Document("Input.docx");

단계 3: HtmlSaveOptions 속성 지정

변환을 위해 HtmlSaveOptions 클래스를 사용하여 다양한 속성을 설정합니다.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

단계 4: HTML 형식으로 출력 저장

Document.Save 메서드를 사용하여 파일을 HTML 형식으로 저장합니다.

doc.Save("HtmlSaveOptions.html", saveOptions);

DOCX를 HTML로 변환하는 예제 코드

다음은 모든 단계를 통합한 완전한 예제입니다:

// 입력 Word DOCX 파일 로드
Document doc = new Document("Input.docx");

// HtmlSaveOptions 클래스의 다양한 속성 설정
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// 출력 HTML 저장
doc.Save("HtmlSaveOptions.html", saveOptions);

결론

이번 튜토리얼에서는 C#을 사용하여 Word 문서를 HTML로 변환하는 방법을 살펴보았습니다. 설명된 단계를 따르면 변환 설정을 사용자 요구에 맞게 조정할 수 있으며, HTML이 원본 문서의 무결성을 유지하도록 할 수 있습니다. 더 탐색하고 싶다면 DOCX 파일을 TIFF와 같은 다른 형식으로 변환하는 자료를 참조해 보세요.

 한국어