Wie man Word-Dokumente in C# mit Aspose.Words liest

Wie man Word-Dokumente in C# mit Aspose.Words liest

Das Lesen von Word-Dokumenten in C# kann mit der Verwendung der Aspose.Words-Bibliothek unkompliziert sein. Dieses Tutorial bietet detaillierte Anweisungen zur Konfiguration Ihrer Umgebung, schrittweise Verfahren zum Lesen von Word-Dateien und ausführbare Codebeispiele. Sie lernen, wie man verschiedene Formate wie DOCX oder DOC liest und wie man auf verschiedene Elemente innerhalb eines Word-Dokuments zugreift.

Vorteile des Lesens von Word-Dokumenten

  1. Zugriff auf Dokumentelemente:
    • Extrahieren und Manipulieren von Absätzen, Tabellen und Textabschnitten.
  2. Einfache Integration:
    • Nahtlose Integration des Lesens von Word-Dokumenten in Ihre C#-Anwendungen.
  3. Vielseitigkeit:
    • Unterschiedliche Word-Formate mühelos handhaben.

Voraussetzungen: Vorbereitung zum Lesen von Word-Dokumenten

  1. Stellen Sie sicher, dass Sie Visual Studio oder eine andere .NET-IDE installiert haben.
  2. Installieren Sie die Aspose.Words-Bibliothek über den NuGet-Paketmanager.
  3. Planen Sie Ihre Projektstruktur, um die für das Tutorial erforderlichen Code-Dateien einzuschließen.

Schritt-für-Schritt-Anleitung zum Lesen eines Word-Dokuments

Schritt 1: Die Umgebung konfigurieren

Fügen Sie in Ihrem .NET-Projekt die Aspose.Words-Bibliothek über den NuGet-Paketmanager hinzu.

Befehl zum Ausführen: Install-Package Aspose.Words


Schritt 2: Die Eingabe-DOCX-Datei laden

Erstellen Sie eine Instanz der Document-Klasse und laden Sie die DOCX-Datei.

using Aspose.Words;

Document doc = new Document("input.docx");

Schritt 3: Alle Absatzknoten abrufen

Rufen Sie alle Knoten vom Typ Paragraph aus dem Dokument ab.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Schritt 4: Alle Run-Knoten abrufen

Rufen Sie alle Knoten vom Typ Run aus dem Dokument ab.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Beispielcode zum Lesen einer Word-Datei in C#

Hier ist der vollständige Code, der alle oben genannten Schritte kombiniert.

// Laden Sie die Quelldatei Word, die gelesen werden soll
Document doc = new Document("input.docx");

// Lesen Sie alle Absätze im Dokument und zeigen Sie deren Inhalt an
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Lesen Sie alle Runs im Dokument und zeigen Sie Stil und Text an
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Fazit

In diesem Tutorial haben Sie gelernt, wie man Word-Dokumente in C# mit Aspose.Words liest, einschließlich Konfiguration und Codebeispiele. Dieses Wissen ermöglicht es Ihnen, auf verschiedene Elemente innerhalb einer Word-Datei zuzugreifen, was die Verarbeitung oder Anzeige des Inhalts nach Bedarf erleichtert. Für weitere Erkundungen können Sie zusätzliche Ressourcen zu der Umwandlung von Word-Dokumenten in HTML oder andere Formate konsultieren.

 Deutsch