Hvordan man læser Word-dokumenter i C# ved hjælp af Aspose.Words

Hvordan man læser Word-dokumenter i C# ved hjælp af Aspose.Words

Læsning af Word-dokumenter i C# kan være nemt med brugen af Aspose.Words-biblioteket. Denne tutorial giver detaljerede instruktioner om, hvordan du konfigurerer din miljø, trin for trin procedurer for læsning af Word-filer, og løbende kode eksempler. Du vil lære, hvordan du læser forskellige formater som DOCX eller DOC, og hvordan du kan få adgang til forskellige elementer inden for et Word-dokument.

Fordelene ved at læse orddokumenter

  • Tilgang til dokumentelementer:- Udveksle og manipulere afsnit, tabeller og runder af tekst.

  • Enkel integration:- Du kan nemt integrere Word-dokument læsning i dine C#-applikationer.

  • Virkelighed:- Behandle forskellige Word-formater hårdt.

Forudsætninger: Forberedelse til Word-dokument læsning

  • Sørg for, at du har Visual Studio eller andre .NET IDE installeret.
  • Installere Aspose.Words-biblioteket via NuGet-pakkeadministratoren.
  • Planlæg din projektstruktur for at inkludere de kodefiler, der er nødvendige for tutorial.

Step-by-step guide til at læse et Word-dokument

Trin 1: Konfigurer miljøet

I dit .NET-projekt skal du tilføje Aspose.Words-biblioteket ved hjælp af NuGet-pakkeadministratoren.

Kommand til at køre:Install-Package Aspose.Words

Trin 2: Lad indtastningen af DOCX-filen

Skab en instans af dokumentklassen og lad filen DOCX op.

using Aspose.Words;

Document doc = new Document("input.docx");

Trin 3: Få alle afsnit noder

Returner alle knuder af typen Paragraf fra dokumentet.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Trin 4: Få alle Run Nodes

Returner alle Run-type noder fra dokumentet.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Eksempel kode til at læse Word-filen i C#

Her er den komplette kode, der kombinerer alle ovennævnte trin.

// Load the source Word file to be read
Document doc = new Document("input.docx");

// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Konklusion

I denne tutorial har du lært, hvordan man læser Word-dokumenter i C# ved hjælp af Aspose.Words, herunder konfiguration og kode eksempler. Denne viden giver dig mulighed for at få adgang til forskellige elementer inden for en Word-fil, hvilket gør det lettere at behandle eller vise indholdet som det er nødvendigt.

 Dansk