Sådan læses Word-dokumenter i C# ved hjælp af Aspose.Words

Sådan læses Word-dokumenter i C# ved hjælp af Aspose.Words

At læse Word-dokumenter i C# kan være ligetil ved brug af Aspose.Words-biblioteket. Denne vejledning giver detaljerede instruktioner om, hvordan du konfigurerer dit miljø, trin-for-trin procedurer for at læse Word-filer og kørbare kodeeksempler. Du vil lære, hvordan du læser forskellige formater såsom DOCX eller DOC, og hvordan du får adgang til forskellige elementer i et Word-dokument.

Fordele ved at læse Word-dokumenter

  1. Adgang til dokumentelementer: - Udtræk og manipulér afsnit, tabeller og tekstsekvenser.
  2. Nem integration: - Integrer problemfrit læsning af Word-dokumenter i dine C#-applikationer.
  3. Alsidighed: - Håndter forskellige Word-formater ubesværet.

Forudsætninger: Forberedelse til læsning af Word-dokumenter

  1. Sørg for, at du har Visual Studio eller en anden .NET IDE installeret.
  2. Langsom ydeevne:Undgå at gemme til MemoryStream for store output; skriv direkte til en FileStream.
  3. Planlæg din projektstruktur, så den inkluderer de kodefiler, der kræves til vejledningen.

Trin-for-trin guide til at læse et Word-dokument

Filkorruption:Sørg for at inputfilerne ikke er beskadigede og er kompatible med Aspose.Words.

Formateringsproblemer:Juster justering og stilarter for at sikre et professionelt udseende.

Kommando til at køre: Install-Package Aspose.Words


Trin 2: Indlæs input DOCX-fil

Opret en instans af Document‑klassen og indlæs DOCX‑filen.

using Aspose.Words;

Document doc = new Document("input.docx");

Trin 3: Hent alle Paragraph‑noder

Hent alle noder af typen Paragraph fra dokumentet.

using System;
using Aspose.Words;

var doc = new Document();

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Trin 4: Hent alle Run‑noder

Hent alle noder af typen Run fra dokumentet.

using System;
using Aspose.Words;

Document doc = new Document();

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Eksempel på kode til at læse Word‑fil i C#

Her er den komplette kode, der kombinerer alle ovenstående trin.

using Aspose.Words;
// Load the source Word file to be read
Document doc = new Document("input.docx");

// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Konklusion

I denne vejledning har du lært, hvordan du læser Word-dokumenter i C# ved hjælp af Aspose.Words, inklusive konfiguration og kodeeksempler. Denne viden gør det muligt for dig at få adgang til forskellige elementer i en Word-fil, hvilket gør det lettere at behandle eller vise indholdet efter behov. For yderligere udforskning kan du henvise til yderligere ressourcer om konvertering af Word-dokumenter til HTML eller andre formater.

 Dansk