Comment convertir un document Word en HTML en utilisant C#

Comment convertir un document Word en HTML en utilisant C#

Dans ce court tutoriel, nous allons apprendre comment convertir un document Word en HTML en utilisant C#. Cette conversion peut être effectuée efficacement sur tout système d’exploitation comme macOS, Linux ou MS Windows où le framework .NET est configuré.

Avantages de la conversion de documents Word en HTML

  1. Compatibilité Web :
    • Les fichiers HTML peuvent être facilement affichés sur les navigateurs web.
  2. Conservation du formatage :
    • La plupart du formatage du document Word peut être préservé dans la sortie HTML.
  3. Fonctionnalité multiplateforme :
    • Les fichiers HTML peuvent être accessibles depuis diverses plateformes sans problèmes de compatibilité.

Guide étape par étape pour convertir un document Word en HTML

Étape 1 : Installer la bibliothèque Aspose.Words

Installez la bibliothèque Aspose.Words en utilisant le gestionnaire de packages NuGet pour faciliter la conversion.

Install-Package Aspose.Words

Étape 2 : Charger le fichier DOCX

Instanciez la classe Document pour charger le document Word que vous souhaitez convertir.

Document doc = new Document("Input.docx");

Étape 3 : Spécifier les propriétés HtmlSaveOptions

Définissez différentes propriétés en utilisant la classe HtmlSaveOptions pour la conversion.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Étape 4 : Enregistrer la sortie au format HTML

Utilisez la méthode Document.Save pour enregistrer le fichier au format HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Exemple de code pour convertir DOCX en HTML

Voici un exemple complet qui regroupe toutes les étapes :

// Charger le fichier Word DOCX d'entrée
Document doc = new Document("Input.docx");

// Définir différentes propriétés de la classe HtmlSaveOptions
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Enregistrer la sortie HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Conclusion

Dans ce tutoriel, nous avons exploré comment convertir un document Word en HTML en utilisant C#. En suivant les étapes décrites, vous pouvez personnaliser les paramètres de conversion pour répondre à vos exigences, en veillant à ce que votre HTML conserve l’intégrité du document original. Pour une exploration plus approfondie, envisagez de consulter des documents sur la conversion de fichiers DOCX dans d’autres formats comme TIFF.

 Français