Comment lire des documents Word en C# en utilisant Aspose.Words
Lire des documents Word en C# peut être simple grâce à l’utilisation de la bibliothèque Aspose.Words. Ce tutoriel fournit des instructions détaillées sur la façon de configurer votre environnement, des procédures étape par étape pour lire des fichiers Word, et des exemples de code exécutables. Vous apprendrez à lire divers formats tels que DOCX ou DOC, et comment accéder à différents éléments au sein d’un document Word.
Avantages de la lecture de documents Word
- Accès aux éléments du document :
- Extraire et manipuler des paragraphes, des tableaux et des blocs de texte.
- Intégration facile :
- Intégrer sans effort la lecture de documents Word dans vos applications C#.
- Polyvalence :
- Gérer différents formats Word sans difficulté.
Prérequis : Préparation à la lecture de documents Word
- Assurez-vous d’avoir Visual Studio ou tout autre IDE .NET installé.
- Installez la bibliothèque Aspose.Words via le gestionnaire de packages NuGet.
- Planifiez la structure de votre projet pour inclure les fichiers de code nécessaires au tutoriel.
Guide étape par étape pour lire un document Word
Étape 1 : Configurer l’environnement
Dans votre projet .NET, ajoutez la bibliothèque Aspose.Words en utilisant le gestionnaire de packages NuGet.
Commande à exécuter :
Install-Package Aspose.Words
Étape 2 : Charger le fichier DOCX d’entrée
Créez une instance de la classe Document et chargez le fichier DOCX.
using Aspose.Words;
Document doc = new Document("input.docx");
Étape 3 : Obtenir tous les nœuds de paragraphe
Récupérez tous les nœuds de type Paragraphe du document.
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
Étape 4 : Obtenir tous les nœuds de type Run
Récupérez tous les nœuds de type Run du document.
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Exemple de code pour lire un fichier Word en C#
Voici le code complet combinant toutes les étapes ci-dessus.
// Charger le fichier Word source à lire
Document doc = new Document("input.docx");
// Lire tous les paragraphes dans le document et afficher leur contenu
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true))
{
Console.WriteLine(para.ToString(SaveFormat.Text));
}
// Lire tous les Runs dans le document et afficher le style et le texte
foreach (Run run in doc.GetChildNodes(NodeType.Run, true))
{
Font font = run.Font;
Console.WriteLine($"{font.Name}, {font.Size}");
Console.WriteLine(run.Text);
}
Conclusion
Dans ce tutoriel, vous avez appris comment lire des documents Word en C# en utilisant Aspose.Words, y compris la configuration et des exemples de code. Cette connaissance vous permet d’accéder à divers éléments au sein d’un fichier Word, facilitant le traitement ou l’affichage du contenu selon vos besoins. Pour une exploration plus approfondie, vous pouvez consulter des ressources supplémentaires sur la conversion de documents Word en HTML ou d’autres formats.