Как читать документы Word в C# с использованием Aspose.Words

Как читать документы Word в C# с использованием Aspose.Words

Читание Word-документов в C# может быть простым с использованием библиотеки Aspose.Words. Этот учебник предоставляет подробные инструкции о том, как конфигурировать свое окружение, шаг за шагом процедуры для чтения Word-файлов, и пропускаемых примеров кода. Вы узнаете, как читать различные форматы, такие как DOCX или DOC, и как получить доступ к различным элементам в Word-документе.

Преимущества чтения слов документов

  • Доступ к элементам документа:- Экстрактировать и манипулировать параграфами, таблицами и потоками текста.

  • Легкая интеграция:- Немедленно интегрируйте чтение Word-документа в приложения C#.

  • Верстальность:- Сделайте разные форматы слова без труда.

Преимущества: подготовка к чтению Word Document

  • Убедитесь, что у вас установлен Visual Studio или любой другой .NET IDE.
  • Настройка библиотеки Aspose.Words через менеджер пакетов NuGet.
  • Планируйте структуру вашего проекта, чтобы включить файлы кода, необходимые для урока.

Шаг за шагом Руководство по чтению Word Document

Шаг 1: Настройка среды

В вашем проекте .NET добавьте библиотеку Aspose.Words с помощью менеджера пакетов NuGet.

Команды для бега:Install-Package Aspose.Words

Шаг 2: Загрузите вводный файл DOCX

Создайте инстанцию класса Документа и загрузите файл DOCX.

using Aspose.Words;

Document doc = new Document("input.docx");

Шаг 3: Получите все ноты параграфа

Отстраивайте все узлы типа Параграф из документа.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Шаг 4: Получайте все ноты

Восстановите все узлы типа Run из документа.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Примерный код для чтения файла Word в C#

Вот полный код, который сочетает все вышеперечисленные шаги.

// Load the source Word file to be read
Document doc = new Document("input.docx");

// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Заключение

В этом уроке вы узнали, как читать Word-документы в C# с помощью Aspose.Words, в том числе конфигурации и примера кода. Это знание позволяет получить доступ к различным элементам в файле Word, что облегчает обработку или отображение контента, как необходимо. Для дальнейшего изучения, вы можете ссылаться на дополнительные ресурсы на конвертирование Word-документов в HTML или другие форматы.

 Русский