Как читать документы Word в C# с использованием Aspose.Words
Читание Word-документов в C# может быть простым с использованием библиотеки Aspose.Words. Этот учебник предоставляет подробные инструкции о том, как конфигурировать свое окружение, шаг за шагом процедуры для чтения Word-файлов, и пропускаемых примеров кода. Вы узнаете, как читать различные форматы, такие как DOCX или DOC, и как получить доступ к различным элементам в Word-документе.
Преимущества чтения слов документов
Доступ к элементам документа:- Экстрактировать и манипулировать параграфами, таблицами и потоками текста.
Легкая интеграция:- Немедленно интегрируйте чтение Word-документа в приложения C#.
Верстальность:- Сделайте разные форматы слова без труда.
Преимущества: подготовка к чтению Word Document
- Убедитесь, что у вас установлен Visual Studio или любой другой .NET IDE.
- Настройка библиотеки Aspose.Words через менеджер пакетов NuGet.
- Планируйте структуру вашего проекта, чтобы включить файлы кода, необходимые для урока.
Шаг за шагом Руководство по чтению Word Document
Шаг 1: Настройка среды
В вашем проекте .NET добавьте библиотеку Aspose.Words с помощью менеджера пакетов NuGet.
Команды для бега:Install-Package Aspose.Words
Шаг 2: Загрузите вводный файл DOCX
Создайте инстанцию класса Документа и загрузите файл DOCX.
using Aspose.Words;
Document doc = new Document("input.docx");
Шаг 3: Получите все ноты параграфа
Отстраивайте все узлы типа Параграф из документа.
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
Шаг 4: Получайте все ноты
Восстановите все узлы типа Run из документа.
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Примерный код для чтения файла Word в C#
Вот полный код, который сочетает все вышеперечисленные шаги.
// Load the source Word file to be read
Document doc = new Document("input.docx");
// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Заключение
В этом уроке вы узнали, как читать Word-документы в C# с помощью Aspose.Words, в том числе конфигурации и примера кода. Это знание позволяет получить доступ к различным элементам в файле Word, что облегчает обработку или отображение контента, как необходимо. Для дальнейшего изучения, вы можете ссылаться на дополнительные ресурсы на конвертирование Word-документов в HTML или другие форматы.