Jak číst dokumenty Word v C# pomocí Aspose.Words

Jak číst dokumenty Word v C# pomocí Aspose.Words

Čtení dokumentů Word v C# může být jednoduché s využitím knihovny Aspose.Words. Tento tutoriál poskytuje podrobné pokyny, jak nakonfigurovat své prostředí, krok za krokem postupy pro čtení souborů Word a spustitelné příklady kódu. Naučíte se, jak číst různé formáty, jako jsou DOCX nebo DOC, a jak přistupovat k různým prvkům v dokumentu Word.

Výhody čtení dokumentů Word

  1. Přístup k prvkům dokumentu:
    • Extrakce a manipulace s odstavci, tabulkami a textovými běhy.
  2. Snadná integrace:
    • Bezproblémová integrace čtení dokumentů Word do vašich aplikací C#.
  3. Univerzálnost:
    • Bez námahy zpracovávejte různé formáty Word.

Požadavky: Příprava na čtení dokumentů Word

  1. Ujistěte se, že máte nainstalován Visual Studio nebo jiný .NET IDE.
  2. Nainstalujte knihovnu Aspose.Words pomocí správce balíčků NuGet.
  3. Naplánujte strukturu svého projektu tak, aby zahrnovala souborové kódy potřebné pro tutoriál.

Krok za krokem průvodce čtením dokumentu Word

Krok 1: Nakonfigurujte prostředí

Ve vašem .NET projektu přidejte knihovnu Aspose.Words pomocí správce balíčků NuGet.

Příkaz k provedení: Install-Package Aspose.Words


Krok 2: Načtěte vstupní soubor DOCX

Vytvořte instanci třídy Document a načtěte soubor DOCX.

using Aspose.Words;

Document doc = new Document("input.docx");

Krok 3: Získejte všechny uzly odstavců

Získejte všechny uzly typu Paragraph z dokumentu.

foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

Krok 4: Získejte všechny uzly běhů

Získejte všechny uzly typu Run z dokumentu.

foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Příklad kódu pro čtení souboru Word v C#

Zde je kompletní kód kombinující všechny výše uvedené kroky.

// Načtěte zdrojový Word soubor, který má být přečten
Document doc = new Document("input.docx");

// Přečtěte všechny odstavce v dokumentu a zobrazte jejich obsah
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
    Console.WriteLine(para.ToString(SaveFormat.Text));
}

// Přečtěte všechny běhy v dokumentu a zobrazte styl a text
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
    Font font = run.Font;
    Console.WriteLine($"{font.Name}, {font.Size}");
    Console.WriteLine(run.Text);
}

Závěr

V tomto tutoriálu jste se naučili, jak číst dokumenty Word v C# pomocí Aspose.Words, včetně konfigurace a příkladů kódu. Tyto znalosti vám umožňují přistupovat k různým prvkům v souboru Word, což usnadňuje zpracování nebo zobrazení obsahu podle potřeby. Pro další zkoumání můžete odkázat na další zdroje o převodu dokumentů Word do HTML nebo jiných formátů.

 Čeština