C# を使用して Word 文書を HTML に変換する方法

C# を使用して Word 文書を HTML に変換する方法

この短いチュートリアルでは、C#を使用してWord文書をHTMLに変換する方法を学びます。この変換は、.NETフレームワークが設定されているmacOS、Linux、またはMS Windowsなどの任意のオペレーティングシステムで効率的に実行できます。

Word文書をHTMLに変換する利点

  1. ウェブ互換性:
    • HTMLファイルはウェブブラウザで簡単に表示できます。
  2. 書式の保持:
    • Word文書のほとんどの書式はHTML出力に保持できます。
  3. クロスプラットフォーム機能:
    • HTMLファイルは、互換性の問題なくさまざまなプラットフォームからアクセスできます。

Word文書をHTMLに変換するためのステップバイステップガイド

ステップ1: Aspose.Wordsライブラリのインストール

NuGetパッケージマネージャーを使用してAspose.Wordsライブラリをインストールし、変換を容易にします。

Install-Package Aspose.Words

ステップ2: DOCXファイルの読み込み

Documentクラスをインスタンス化して、変換したいWord文書を読み込みます。

Document doc = new Document("Input.docx");

ステップ3: HtmlSaveOptionsプロパティの指定

変換のためにHtmlSaveOptionsクラスを使用してさまざまなプロパティを設定します。

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

ステップ4: 出力をHTMLとして保存

Document.Saveメソッドを使用して、ファイルをHTML形式で保存します。

doc.Save("HtmlSaveOptions.html", saveOptions);

DOCXをHTMLに変換するためのサンプルコード

すべてのステップをまとめた完全な例を以下に示します:

// 入力Word DOCXファイルを読み込む
Document doc = new Document("Input.docx");

// HtmlSaveOptionsクラスのさまざまなプロパティを設定
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// 出力HTMLを保存
doc.Save("HtmlSaveOptions.html", saveOptions);

結論

このチュートリアルでは、C#を使用してWord文書をHTMLに変換する方法を探りました。示された手順に従うことで、変換設定をカスタマイズし、HTMLが元の文書の整合性を保持するようにできます。さらに探求するために、DOCXファイルをTIFFなどの他のフォーマットに変換する材料を参照することを検討してください。

 日本語