Comment convertir un document Word en HTML avec C#
Dans ce court tutoriel, nous apprendrons comment convertir un document Word en HTML avec C#. Cette conversion peut être effectuée efficacement sur n’importe quel système d’exploitation tel que macOS, Linux ou MS Windows où le cadre .NET est configuré.
Avantages de convertir des documents Word en HTML
- Compatibilité Web: - Les fichiers HTML peuvent être affichés facilement dans les navigateurs web.
- Conservation du formatage: - La plupart du formatage du document Word peut être conservé dans la sortie HTML.
- Fonctionnalité multiplateforme: - Les fichiers HTML peuvent être accessibles depuis diverses plateformes sans problèmes de compatibilité.
Guide étape par étape pour convertir un document Word en HTML
Étape 1 : Installer la bibliothèque Aspose.Words
Explication :.
Install-Package Aspose.WordsÉtape 2 : charger le fichier DOCX
Instanciez la classe Document pour charger le document Word que vous souhaitez convertir.
Document doc = new Document("Input.docx");Étape 3 : spécifier les propriétés de HtmlSaveOptions
Définissez différentes propriétés à l’aide de la classe HtmlSaveOptions pour la conversion.
using Aspose.Words.Saving;
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;Étape 4 : enregistrer la sortie au format HTML
Utilisez la méthode Document.Save pour enregistrer le fichier au format HTML.
doc.Save("HtmlSaveOptions.html", saveOptions);Exemple de code pour convertir DOCX en HTML
Voici un exemple complet qui regroupe toutes les étapes:
using Aspose.Words;
using Aspose.Words.Saving;
// Load input Word DOCX file
Document doc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;
// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);Conclusion
Dans ce tutoriel, nous avons exploré comment convertir un document Word en HTML à l’aide de C#. En suivant les étapes décrites, vous pouvez personnaliser les paramètres de conversion pour répondre à vos exigences, en veillant à ce que votre HTML conserve l’intégrité du document original. Pour aller plus loin, envisagez de consulter des ressources sur la conversion de fichiers DOCX vers d’autres formats comme le TIFF.