C# を使用して Word 文書を HTML に変換する方法
C# を使用して Word 文書を HTML に変換する方法
この短いチュートリアルでは、C#を使用してWord文書をHTMLに変換する方法を学びます。この変換は、.NETフレームワークが設定されているmacOS、Linux、またはMS Windowsなどの任意のオペレーティングシステムで効率的に実行できます。
Word文書をHTMLに変換する利点
- ウェブ互換性:
- HTMLファイルはウェブブラウザで簡単に表示できます。
- 書式の保持:
- Word文書のほとんどの書式はHTML出力に保持できます。
- クロスプラットフォーム機能:
- HTMLファイルは、互換性の問題なくさまざまなプラットフォームからアクセスできます。
Word文書をHTMLに変換するためのステップバイステップガイド
ステップ1: Aspose.Wordsライブラリのインストール
NuGetパッケージマネージャーを使用してAspose.Wordsライブラリをインストールし、変換を容易にします。
Install-Package Aspose.Words
ステップ2: DOCXファイルの読み込み
Documentクラスをインスタンス化して、変換したいWord文書を読み込みます。
Document doc = new Document("Input.docx");
ステップ3: HtmlSaveOptionsプロパティの指定
変換のためにHtmlSaveOptionsクラスを使用してさまざまなプロパティを設定します。
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;
ステップ4: 出力をHTMLとして保存
Document.Saveメソッドを使用して、ファイルをHTML形式で保存します。
doc.Save("HtmlSaveOptions.html", saveOptions);
DOCXをHTMLに変換するためのサンプルコード
すべてのステップをまとめた完全な例を以下に示します:
// 入力Word DOCXファイルを読み込む
Document doc = new Document("Input.docx");
// HtmlSaveOptionsクラスのさまざまなプロパティを設定
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;
// 出力HTMLを保存
doc.Save("HtmlSaveOptions.html", saveOptions);
結論
このチュートリアルでは、C#を使用してWord文書をHTMLに変換する方法を探りました。示された手順に従うことで、変換設定をカスタマイズし、HTMLが元の文書の整合性を保持するようにできます。さらに探求するために、DOCXファイルをTIFFなどの他のフォーマットに変換する材料を参照することを検討してください。