Hur man läser Word-dokument i C# med Aspose.Words
Att läsa Word-dokument i C# kan vara enkelt med hjälp av Aspose.Words-biblioteket. Denna handledning ger detaljerade instruktioner om hur du konfigurerar din miljö, steg-för-steg procedurer för att läsa Word-filer och körbara kodexempel. Du kommer att lära dig hur man läser olika format som DOCX eller DOC, och hur man får tillgång till olika element inom ett Word-dokument.
Fördelar med att läsa Word-dokument
- Åtkomst till dokumentelement:
- Extrahera och manipulera stycken, tabeller och textstycken.
- Enkel integration:
- Sömlöst integrera läsning av Word-dokument i dina C#-applikationer.
- Mångsidighet:
- Hantera olika Word-format utan ansträngning.
Förutsättningar: Förbereda för läsning av Word-dokument
- Se till att du har Visual Studio eller någon annan .NET IDE installerad.
- Installera Aspose.Words-biblioteket via NuGet-pakethanteraren.
- Planera din projektstruktur för att inkludera de kodfiler som krävs för handledningen.
Steg-för-steg-guide för att läsa ett Word-dokument
Steg 1: Konfigurera miljön
I ditt .NET-projekt, lägg till Aspose.Words-biblioteket med hjälp av NuGet-pakethanteraren.
Kommando att köra:
Install-Package Aspose.Words
Steg 2: Ladda in DOCX-filen
Skapa en instans av Document-klassen och ladda DOCX-filen.
using Aspose.Words;
Document doc = new Document("input.docx");
Steg 3: Hämta alla styckesnoder
Hämta alla noder av typen Paragraph från dokumentet.
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
Steg 4: Hämta alla Run-noder
Hämta alla noder av typen Run från dokumentet.
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Exempel på kod för att läsa Word-fil i C#
Här är den kompletta koden som kombinerar alla ovanstående steg.
// Ladda källan Word-fil som ska läsas
Document doc = new Document("input.docx");
// Läs alla stycken i dokumentet och visa deras innehåll
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// Läs alla Runs i dokumentet och visa stil och text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Slutsats
I denna handledning har du lärt dig hur man läser Word-dokument i C# med hjälp av Aspose.Words, inklusive konfiguration och kodexempel. Denna kunskap gör det möjligt för dig att få tillgång till olika element inom en Word-fil, vilket gör det enklare att bearbeta eller visa innehållet efter behov. För vidare utforskning kan du hänvisa till ytterligare resurser om att konvertera Word-dokument till HTML eller andra format.