C#でAspose.Wordsを使用してWord文書を読む方法

C#でAspose.Wordsを使用してWord文書を読む方法

C#でWord文書を読み取ることは、Aspose.Wordsライブラリを使用することで簡単に行えます。このチュートリアルでは、環境の設定方法、Wordファイルを読み取るための手順、実行可能なコード例を詳しく説明します。DOCXやDOCなどのさまざまなフォーマットを読み取る方法や、Word文書内のさまざまな要素にアクセスする方法を学びます。

Word文書を読むことの利点

  1. 文書要素へのアクセス:
    • 段落、表、テキストのランを抽出して操作します。
  2. 簡単な統合:
    • C#アプリケーションにWord文書の読み取りをシームレスに統合します。
  3. 多用途性:
    • 異なるWordフォーマットを簡単に扱います。

前提条件: Word文書の読み取り準備

  1. Visual Studioまたは他の.NET IDEがインストールされていることを確認します。
  2. NuGetパッケージマネージャーを使用してAspose.Wordsライブラリをインストールします。
  3. チュートリアルに必要なコードファイルを含むプロジェクト構造を計画します。

Word文書を読むためのステップバイステップガイド

ステップ1: 環境を設定する

.NETプロジェクトにNuGetパッケージマネージャーを使用してAspose.Wordsライブラリを追加します。

実行するコマンド: Install-Package Aspose.Words


ステップ2: 入力DOCXファイルを読み込む

Documentクラスのインスタンスを作成し、DOCXファイルを読み込みます。

using Aspose.Words;

Document doc = new Document("input.docx");

ステップ3: すべての段落ノードを取得する

文書からParagraph型のすべてのノードを取得します。

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

ステップ4: すべてのランノードを取得する

文書からRun型のすべてのノードを取得します。

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

C#でWordファイルを読むための例コード

上記のすべてのステップを組み合わせた完全なコードは以下の通りです。

// 読み取るソースWordファイルを読み込む
Document doc = new Document("input.docx");

// 文書内のすべての段落を読み取り、その内容を表示する
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// 文書内のすべてのRunを読み取り、スタイルとテキストを表示する
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

結論

このチュートリアルでは、Aspose.Wordsを使用してC#でWord文書を読み取る方法、設定方法、コード例について学びました。この知識により、Wordファイル内のさまざまな要素にアクセスできるようになり、必要に応じてコンテンツを処理または表示することが容易になります。さらに探求するためには、Word文書をHTMLや他のフォーマットに変換するための追加リソースを参照してください。

 日本語