Sådan læses Word-dokumenter i C# ved hjælp af Aspose.Words
At læse Word-dokumenter i C# kan være ligetil ved brug af Aspose.Words-biblioteket. Denne vejledning giver detaljerede instruktioner om, hvordan du konfigurerer dit miljø, trin-for-trin procedurer for at læse Word-filer og kørbare kodeeksempler. Du vil lære, hvordan du læser forskellige formater såsom DOCX eller DOC, og hvordan du får adgang til forskellige elementer i et Word-dokument.
Fordele ved at læse Word-dokumenter
- Adgang til dokumentelementer: - Udtræk og manipulér afsnit, tabeller og tekstsekvenser.
- Nem integration: - Integrer problemfrit læsning af Word-dokumenter i dine C#-applikationer.
- Alsidighed: - Håndter forskellige Word-formater ubesværet.
Forudsætninger: Forberedelse til læsning af Word-dokumenter
- Sørg for, at du har Visual Studio eller en anden .NET IDE installeret.
- Langsom ydeevne:Undgå at gemme til
MemoryStreamfor store output; skriv direkte til enFileStream. - Planlæg din projektstruktur, så den inkluderer de kodefiler, der kræves til vejledningen.
Trin-for-trin guide til at læse et Word-dokument
Filkorruption:Sørg for at inputfilerne ikke er beskadigede og er kompatible med Aspose.Words.
Formateringsproblemer:Juster justering og stilarter for at sikre et professionelt udseende.
Kommando til at køre: Install-Package Aspose.Words
Trin 2: Indlæs input DOCX-fil
Opret en instans af Document‑klassen og indlæs DOCX‑filen.
using Aspose.Words;
Document doc = new Document("input.docx");Trin 3: Hent alle Paragraph‑noder
Hent alle noder af typen Paragraph fra dokumentet.
using System;
using Aspose.Words;
var doc = new Document();
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}Trin 4: Hent alle Run‑noder
Hent alle noder af typen Run fra dokumentet.
using System;
using Aspose.Words;
Document doc = new Document();
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}Eksempel på kode til at læse Word‑fil i C#
Her er den komplette kode, der kombinerer alle ovenstående trin.
using Aspose.Words;
// Load the source Word file to be read
Document doc = new Document("input.docx");
// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}Konklusion
I denne vejledning har du lært, hvordan du læser Word-dokumenter i C# ved hjælp af Aspose.Words, inklusive konfiguration og kodeeksempler. Denne viden gør det muligt for dig at få adgang til forskellige elementer i en Word-fil, hvilket gør det lettere at behandle eller vise indholdet efter behov. For yderligere udforskning kan du henvise til yderligere ressourcer om konvertering af Word-dokumenter til HTML eller andre formater.