Як читати документи Word у C# за допомогою Aspose.Words

Як читати документи Word у C# за допомогою Aspose.Words

Читання документів Word у C# може бути простим за допомогою бібліотеки Aspose.Words. Цей підручник надає детальні інструкції щодо налаштування вашого середовища, покрокові процедури для читання файлів Word і приклади коду, які можна виконати. Ви дізнаєтеся, як читати різні формати, такі як DOCX або DOC, а також як отримувати доступ до різних елементів у документі Word.

Переваги читання документів Word

  1. Доступ до елементів документа:
    • Витягувати та маніпулювати абзацами, таблицями та фрагментами тексту.
  2. Легка інтеграція:
    • Безперешкодно інтегрувати читання документів Word у ваші C# програми.
  3. Універсальність:
    • Легко працювати з різними форматами Word.

Попередні вимоги: Підготовка до читання документів Word

  1. Переконайтеся, що у вас встановлено Visual Studio або будь-який інший .NET IDE.
  2. Встановіть бібліотеку Aspose.Words через менеджер пакетів NuGet.
  3. Сплануйте структуру вашого проєкту, щоб включити файли коду, необхідні для підручника.

Покрокова інструкція з читання документа Word

Крок 1: Налаштування середовища

У вашому .NET проєкті додайте бібліотеку Aspose.Words за допомогою менеджера пакетів NuGet.

Команда для виконання: Install-Package Aspose.Words


Крок 2: Завантаження вхідного файлу DOCX

Створіть екземпляр класу Document і завантажте файл DOCX.

using Aspose.Words;

Document doc = new Document("input.docx");

Крок 3: Отримання всіх вузлів абзаців

Отримайте всі вузли типу Paragraph з документа.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Крок 4: Отримання всіх вузлів Run

Отримайте всі вузли типу Run з документа.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Приклад коду для читання файлу Word у C#

Ось повний код, що об’єднує всі вищезазначені кроки.

// Завантажте вихідний файл Word для читання
Document doc = new Document("input.docx");

// Читайте всі абзаци в документі та відображайте їх вміст
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Читайте всі Runs у документі та відображайте стиль і текст
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Висновок

У цьому підручнику ви дізналися, як читати документи Word у C# за допомогою Aspose.Words, включаючи налаштування та приклади коду. Це знання дозволяє вам отримувати доступ до різних елементів у файлі Word, що спрощує обробку або відображення вмісту за потреби. Для подальшого вивчення ви можете звернутися до додаткових ресурсів з конвертації документів Word у HTML або інші формати.

 Українська