# Como Converter Documento Word para HTML Usando C# ```csharp using System; using System.IO; using Microsoft.Office.Interop.Word; class Program { static void Main() { Application wordApp = new Application(); Document doc = wordApp.Documents.Open(@"C:\caminho\para\seu\documento.docx"); string htmlFilePath = @"C:\caminho\para\seu\documento.html"; doc.SaveAs2(htmlFilePath, WdSaveFormat.wdFormatFilteredHTML); doc.Close(); wordApp.Quit(); Console.WriteLine("Documento convertido com sucesso para HTML!"); } }
Neste curto tutorial, aprenderemos como converter um documento do Word para HTML usando C#. Esta conversão pode ser efetivamente realizada em qualquer sistema operacional como macOS, Linux, ou MS Windows onde o .NET framework é configurado.
Benefícios da conversão de documentos do Word para HTML
Compatibilidade da Web:- Os arquivos HTML podem ser facilmente exibidos em navegadores da web.
Formato de retenção:- A maioria do formato do documento Word pode ser preservada na saída HTML.
Funcionalidade da plataforma:- Os arquivos HTML podem ser acessados de várias plataformas sem problemas de compatibilidade.
Guia passo a passo para converter um documento Word para HTML
Passo 1: Instale a biblioteca Aspose.Words
Instale a biblioteca Aspose.Words usando o gerenciador de pacotes NuGet para facilitar a conversão.
Install-Package Aspose.Words
Passo 2: Carregar o arquivo DOCX
Instale a classe de Documentos para carregar o documento do Word que você deseja converter.
Document doc = new Document("Input.docx");
Passo 3: especifique as propriedades da HtmlSaveOptions
Configurar propriedades diferentes usando a classe HtmlSaveOptions para a conversão.
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;
Passo 4: Salve a saída como HTML
Use o método Document.Save para salvar o arquivo em formato HTML.
doc.Save("HtmlSaveOptions.html", saveOptions);
Exemplo de código para converter DOCX para HTML
Aqui está um exemplo completo que coloca todos os passos juntos:
// Load input Word DOCX file
Document doc = new Document("Input.docx");
// Set different properties of HtmlSaveOptions class
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;
// Save output HTML
doc.Save("HtmlSaveOptions.html", saveOptions);
Conclusão
Neste tutorial, exploramos como converter um documento do Word para HTML usando C#. Ao seguir os passos indicados, você pode personalizar as configurações de conversão para atender às suas necessidades, garantindo que o seu HTML mantém a integridade do documento original. Para mais exploração, considere referir-se a materiais sobre a conversão de arquivos DOCX para outros formatos como TIFF.