Como Converter Documento Word para HTML Usando C#

Como Converter Documento Word para HTML Usando C#

Neste breve tutorial, aprenderemos como converter um documento Word para HTML usando C#. Essa conversão pode ser realizada de maneira eficiente em qualquer sistema operacional como macOS, Linux ou MS Windows onde o framework .NET esteja configurado.

Benefícios de Converter Documentos Word para HTML

  1. Compatibilidade com a Web:
    • Arquivos HTML podem ser facilmente exibidos em navegadores web.
  2. Retenção de Formatação:
    • A maior parte da formatação do documento Word pode ser preservada na saída HTML.
  3. Funcionalidade Multiplataforma:
    • Arquivos HTML podem ser acessados a partir de várias plataformas sem problemas de compatibilidade.

Guia Passo a Passo para Converter Documento Word para HTML

Passo 1: Instalar a Biblioteca Aspose.Words

Instale a biblioteca Aspose.Words usando o gerenciador de pacotes NuGet para facilitar a conversão.

Install-Package Aspose.Words

Passo 2: Carregar o Arquivo DOCX

Instancie a classe Document para carregar o documento Word que você deseja converter.

Document doc = new Document("Input.docx");

Passo 3: Especificar Propriedades de HtmlSaveOptions

Defina diferentes propriedades usando a classe HtmlSaveOptions para a conversão.

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

Passo 4: Salvar a Saída como HTML

Use o método Document.Save para salvar o arquivo no formato HTML.

doc.Save("HtmlSaveOptions.html", saveOptions);

Código de Exemplo para Converter DOCX para HTML

Aqui está um exemplo completo que reúne todos os passos:

// Carregar arquivo Word DOCX de entrada
Document doc = new Document("Input.docx");

// Definir diferentes propriedades da classe HtmlSaveOptions
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline;
saveOptions.ExportPageMargins = true;
saveOptions.ImageResolution = 90;

// Salvar saída HTML
doc.Save("HtmlSaveOptions.html", saveOptions);

Conclusão

Neste tutorial, exploramos como converter um documento Word para HTML usando C#. Ao seguir os passos descritos, você pode personalizar as configurações de conversão para atender às suas necessidades, garantindo que seu HTML mantenha a integridade do documento original. Para uma exploração mais aprofundada, considere consultar materiais sobre a conversão de arquivos DOCX para outros formatos, como TIFF.

 Português