Як читати документи Word у C# за допомогою Aspose.Words
Читання документів Word у C# може бути простим за допомогою бібліотеки Aspose.Words. Цей підручник надає детальні інструкції щодо налаштування вашого середовища, покрокові процедури для читання файлів Word і приклади коду, які можна виконати. Ви дізнаєтеся, як читати різні формати, такі як DOCX або DOC, а також як отримувати доступ до різних елементів у документі Word.
Переваги читання документів Word
- Доступ до елементів документа:
- Витягувати та маніпулювати абзацами, таблицями та фрагментами тексту.
- Легка інтеграція:
- Безперешкодно інтегрувати читання документів Word у ваші C# програми.
- Універсальність:
- Легко працювати з різними форматами Word.
Попередні вимоги: Підготовка до читання документів Word
- Переконайтеся, що у вас встановлено Visual Studio або будь-який інший .NET IDE.
- Встановіть бібліотеку Aspose.Words через менеджер пакетів NuGet.
- Сплануйте структуру вашого проєкту, щоб включити файли коду, необхідні для підручника.
Покрокова інструкція з читання документа Word
Крок 1: Налаштування середовища
У вашому .NET проєкті додайте бібліотеку Aspose.Words за допомогою менеджера пакетів NuGet.
Команда для виконання:
Install-Package Aspose.Words
Крок 2: Завантаження вхідного файлу DOCX
Створіть екземпляр класу Document і завантажте файл DOCX.
using Aspose.Words;
Document doc = new Document("input.docx");
Крок 3: Отримання всіх вузлів абзаців
Отримайте всі вузли типу Paragraph з документа.
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
Крок 4: Отримання всіх вузлів Run
Отримайте всі вузли типу Run з документа.
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Приклад коду для читання файлу Word у C#
Ось повний код, що об’єднує всі вищезазначені кроки.
// Завантажте вихідний файл Word для читання
Document doc = new Document("input.docx");
// Читайте всі абзаци в документі та відображайте їх вміст
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// Читайте всі Runs у документі та відображайте стиль і текст
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Висновок
У цьому підручнику ви дізналися, як читати документи Word у C# за допомогою Aspose.Words, включаючи налаштування та приклади коду. Це знання дозволяє вам отримувати доступ до різних елементів у файлі Word, що спрощує обробку або відображення вмісту за потреби. Для подальшого вивчення ви можете звернутися до додаткових ресурсів з конвертації документів Word у HTML або інші формати.