Jak czytać dokumenty Word w C# za pomocą Aspose.Words

Jak czytać dokumenty Word w C# za pomocą Aspose.Words

Czytanie dokumentów Word w C# może być proste dzięki użyciu biblioteki Aspose.Words. Ten samouczek zawiera szczegółowe instrukcje dotyczące konfiguracji środowiska, krok po kroku procedury czytania plików Word oraz działające przykłady kodu. Nauczysz się, jak czytać różne formaty, takie jak DOCX czy DOC, oraz jak uzyskiwać dostęp do różnych elementów w dokumencie Word.

Korzyści z Czytania Dokumentów Word

  1. Dostęp do Elementów Dokumentu:
    • Ekstrahuj i manipuluj akapitami, tabelami i fragmentami tekstu.
  2. Łatwa Integracja:
    • Płynnie zintegrować czytanie dokumentów Word w swoich aplikacjach C#.
  3. Wszechstronność:
    • Obsługuj różne formaty Word bez wysiłku.

Wymagania wstępne: Przygotowanie do Czytania Dokumentów Word

  1. Upewnij się, że masz zainstalowane Visual Studio lub dowolne inne IDE .NET.
  2. Zainstaluj bibliotekę Aspose.Words za pośrednictwem menedżera pakietów NuGet.
  3. Zaplanuj strukturę projektu, aby uwzględnić pliki kodu wymagane w samouczku.

Przewodnik Krok po Kroku do Czytania Dokumentu Word

Krok 1: Skonfiguruj Środowisko

W swoim projekcie .NET dodaj bibliotekę Aspose.Words za pomocą menedżera pakietów NuGet.

Polecenie do uruchomienia: Install-Package Aspose.Words


Krok 2: Załaduj Plik DOCX

Utwórz instancję klasy Document i załaduj plik DOCX.

using Aspose.Words;

Document doc = new Document("input.docx");

Krok 3: Uzyskaj Wszystkie Węzły Akapitów

Pobierz wszystkie węzły typu Paragraph z dokumentu.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Krok 4: Uzyskaj Wszystkie Węzły Run

Pobierz wszystkie węzły typu Run z dokumentu.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Przykład Kodu do Czytania Pliku Word w C#

Oto kompletny kod łączący wszystkie powyższe kroki.

// Załaduj źródłowy plik Word do odczytu
Document doc = new Document("input.docx");

// Odczytaj wszystkie akapity w dokumencie i wyświetl ich zawartość
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Odczytaj wszystkie Runs w dokumencie i wyświetl styl oraz tekst
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Podsumowanie

W tym samouczku nauczyłeś się, jak czytać dokumenty Word w C# za pomocą Aspose.Words, w tym konfiguracji i przykładów kodu. Ta wiedza umożliwia dostęp do różnych elementów w pliku Word, co ułatwia przetwarzanie lub wyświetlanie zawartości w razie potrzeby. Aby dalej eksplorować, możesz zapoznać się z dodatkowymi zasobami na temat konwersji dokumentów Word do HTML lub innych formatów.

 Polski