Hur man läser Word-dokument i C# med Aspose.Words

Hur man läser Word-dokument i C# med Aspose.Words

Att läsa Word-dokument i C# kan vara enkelt med hjälp av Aspose.Words-biblioteket. Denna handledning ger detaljerade instruktioner om hur du konfigurerar din miljö, steg-för-steg procedurer för att läsa Word-filer och körbara kodexempel. Du kommer att lära dig hur man läser olika format som DOCX eller DOC, och hur man får tillgång till olika element inom ett Word-dokument.

Fördelar med att läsa Word-dokument

  1. Åtkomst till dokumentelement:
    • Extrahera och manipulera stycken, tabeller och textstycken.
  2. Enkel integration:
    • Sömlöst integrera läsning av Word-dokument i dina C#-applikationer.
  3. Mångsidighet:
    • Hantera olika Word-format utan ansträngning.

Förutsättningar: Förbereda för läsning av Word-dokument

  1. Se till att du har Visual Studio eller någon annan .NET IDE installerad.
  2. Installera Aspose.Words-biblioteket via NuGet-pakethanteraren.
  3. Planera din projektstruktur för att inkludera de kodfiler som krävs för handledningen.

Steg-för-steg-guide för att läsa ett Word-dokument

Steg 1: Konfigurera miljön

I ditt .NET-projekt, lägg till Aspose.Words-biblioteket med hjälp av NuGet-pakethanteraren.

Kommando att köra: Install-Package Aspose.Words


Steg 2: Ladda in DOCX-filen

Skapa en instans av Document-klassen och ladda DOCX-filen.

using Aspose.Words;

Document doc = new Document("input.docx");

Steg 3: Hämta alla styckesnoder

Hämta alla noder av typen Paragraph från dokumentet.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Steg 4: Hämta alla Run-noder

Hämta alla noder av typen Run från dokumentet.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Exempel på kod för att läsa Word-fil i C#

Här är den kompletta koden som kombinerar alla ovanstående steg.

// Ladda källan Word-fil som ska läsas
Document doc = new Document("input.docx");

// Läs alla stycken i dokumentet och visa deras innehåll
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Läs alla Runs i dokumentet och visa stil och text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Slutsats

I denna handledning har du lärt dig hur man läser Word-dokument i C# med hjälp av Aspose.Words, inklusive konfiguration och kodexempel. Denna kunskap gör det möjligt för dig att få tillgång till olika element inom en Word-fil, vilket gör det enklare att bearbeta eller visa innehållet efter behov. För vidare utforskning kan du hänvisa till ytterligare resurser om att konvertera Word-dokument till HTML eller andra format.

 Svenska