Hur man läser Word-dokument i C# med Aspose.Words

Hur man läser Word-dokument i C# med Aspose.Words

Läs Word-dokument i C# kan vara enkelt med användningen av Aspose.Words-biblioteket. Denna tutorial ger detaljerade instruktioner om hur du konfigurerar din miljö, steg för steg procedurer för att läsa Word filer, och körbara kodexempel. Du lär dig hur man läser olika format såsom DOCX eller DOC, och hur man får tillgång till olika element inom ett Word-dokument.

Fördelar med att läsa Word-dokument

  • Tillgång till dokumentelement:- Extract och manipulera paragrafer, tabeller och runs av text.

  • Enkel integration:- Integrera Word-dokumentläsning i dina C#-applikationer.

  • Värdighet och variation:- Hantera olika Word-format utan ansträngning.

Förutsättningar: Förberedelse för Word Document Reading

  • Se till att du har Visual Studio eller någon annan .NET IDE installerad.
  • Installera Aspose.Words-biblioteket via NuGet Package Manager.
  • Planera din projektstruktur för att inkludera de kodfiler som krävs för tutorial.

Steg för steg guide för att läsa ett Word-dokument

Steg 1: Konfigurera miljön

I ditt .NET-projekt lägger du till Aspose.Words-biblioteket med NuGet-pakethanteraren.

Kommandot att köra:Install-Package Aspose.Words

Steg 2: Ladda upp Input DOCX-filen

Skapa en instans av dokumentklassen och ladda upp DOCX-filen.

using Aspose.Words;

Document doc = new Document("input.docx");

Steg 3: Få alla avsnitt noder

Ta bort alla noder av typ Paragraf från dokumentet.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Steg 4: Få alla Run Nodes

Återställa alla Run-typ noder från dokumentet.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Exempelkod för att läsa Word-filen i C#

Här är den kompletta koden som kombinerar alla ovanstående steg.

// Load the source Word file to be read
Document doc = new Document("input.docx");

// Read all paragraphs in the document and display their content
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Read all Runs in the document and display style and text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

slutsatser

I denna tutorial har du lärt dig hur du läser Word-dokument i C# med hjälp av Aspose.Words, inklusive konfiguration och kodexempel. Denna kunskap gör att du kan komma åt olika element inom en Word-fil, vilket gör det lättare att bearbeta eller visa innehållet som behövs. För ytterligare utforskning kan du hänvisa till ytterligare resurser om att konvertera Word-dokument till HTML eller andra format.

 Svenska