Converter word em html com imagens incorporadas em Java

Como converter arquivo do Word para HTML em Java usando a API REST

Como desenvolvedor Java, pode ser necessário converter um arquivo DOC Word para HTML. Por exemplo, para tornar o documento mais acessível na internet, mais rápido para carregar e ocupar menos espaço de armazenamento. Além disso, o HTML é um ótimo formato para publicar documentos online, como em um site ou blog para ler e compartilhar. Portanto, neste tutorial, aprenderemos como converter arquivo do Word para HTML em Java usando a API REST.

Os seguintes tópicos serão abordados neste artigo:

API REST de conversão de Java Word para HTML e instalação do SDK

Para converter arquivos DOC do Word em páginas HTML, usarei o Java SDK do GroupDocs.Conversion Cloud API. Ele ajuda você a integrar a API GroupDocs.Conversion Cloud em seus aplicativos Java de forma rápida e fácil. Esta é a melhor API de conversão de Word para HTML que mantém o formato de texto original e layouts de seus documentos. Nossa API de conversão também permite que você converta seus documentos e imagens de qualquer formato de arquivo suportado para qualquer formato que você precisar. Você pode converter facilmente mais de 50 tipos de arquivos e imagens como Word, PDF, PowerPoint, Excel, HTML, CAD, imagens raster, etc.

Você pode baixar o arquivo JAR da API ou instalar usando as configurações do Maven. Adicione o repositório e a dependência ao POM.xml do seu projeto. Abaixo estão as instruções para o Maven:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Obtenha seu ID e segredo do cliente no [painel] antes de começar a seguir as etapas e os trechos de código disponíveis. Por favor, digite o código mostrado abaixo depois de ter seu ID e segredo:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro gratuito.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Converter documento do Word em arquivo HTML em Java usando a API REST

Converter um documento do Word em um arquivo HTML pode ser útil de várias maneiras. Ele permite fácil visualização e compartilhamento on-line, é leve, mais acessível aos usuários e mais versátil em diferentes contextos. A conversão de DOC para HTML melhora a legibilidade e o compartilhamento dos documentos na Internet. A seguir estão as etapas para converter um arquivo do Word em um documento HTML, conforme mencionado abaixo:

Carregar o arquivo

Em primeiro lugar, carregue o documento do Word para o armazenamento em nuvem usando o trecho de código fornecido abaixo:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Carregar arquivo para armazenamento em nuvem usando Java
public class App {

	public static void main(String[] args) {
				
		// Crie uma instância da API de conversão					
		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Como resultado, o arquivo do Word carregado estará disponível na seção de arquivos do seu painel na nuvem.

Converter documento do Word para HTML em Java

Esta seção é sobre como converter um arquivo do Word em uma página HTML programaticamente em Java seguindo as etapas abaixo:

  • Primeiramente, crie uma instância da classe ConvertApi.
  • Em segundo lugar, crie uma instância da classe ConvertSettings.
  • Em terceiro lugar, forneça o nome do armazenamento em nuvem.
  • Em seguida, defina o caminho do arquivo do Word de entrada e o formato do arquivo de saída como “html”.
  • Agora, defina o caminho do arquivo HTML de saída.
  • Em seguida, crie a instância da classe ConvertDocumentRequest com os parâmetros ConvertSettings.
  • Por fim, chame o método convertdocument() com os parâmetros ConvertDocumentRequest.

O trecho de código a seguir mostra como converter arquivo do Word em documento HTML em Java usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Como converter documento do Word em página da Web HTML em Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API de conversão
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Preparar configurações de conversão
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.docx");
			settings.setFormat("html");
			
			settings.setOutputPath("java-testing/output-sample-file.html");
		
			// converter para o formato especificado
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document converted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}
Converter Word DOC para arquivo HTML usando Java

Como converter documento do Word para HTML em Java.

Baixe o arquivo convertido

O exemplo de código acima salvará a página da Web HTML convertida na nuvem. Você pode baixá-lo usando o seguinte trecho de código:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Baixe o arquivo do armazenamento em nuvem em Java
public class App {

	public static void main(String[] args) {
				
		// Crie uma instância da API de conversão					
		FileApi apiInstance = new FileApi(configuration);
		try {
			DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.html", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.err.println("Expected response type is File: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

É assim que a biblioteca Java funciona para a conversão de um arquivo do Word em um documento HTML. Examinaremos configurações de conversão mais avançadas usando a API Java na próxima seção.

Converter arquivo do Word em documento HTML em Java usando opções avançadas

Nesta seção, converteremos o documento do Word em arquivo HTML usando algumas configurações avançadas programaticamente, seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância da classe ConvertApi.
  • Em segundo lugar, crie uma instância da classe ConvertSettings.
  • Em seguida, forneça o nome do armazenamento em nuvem.
  • Defina o caminho do arquivo do Word de entrada e o formato do arquivo de saída como “html”.
  • Em seguida, crie uma instância da classe HtmlConvertOptions.
  • Defina várias opções de conversão como setFromPage, setFromPage, setFixedLayout, etc.
  • Agora, defina as opções de conversão e o caminho do arquivo de saída usando a instância ConvertSettings.
  • Crie instância de classe ConvertDocumentRequest com ConvertSettings.
  • Por fim, chame o método convertdocument() e passe o parâmetro ConvertDocumentRequest.

Siga as etapas mencionadas anteriormente para fazer upload e download dos arquivos. O exemplo de código a seguir mostra como converter um documento do Word em uma página da Web HTML usando configurações avançadas:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Java converte o arquivo DOCX do Word em arquivo HTML usando configurações adicionais.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API de conversão
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Preparar configurações de conversão
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.docx");
			settings.setFormat("html");
			
			HtmlConvertOptions convertOptions = new HtmlConvertOptions();
			convertOptions.setFromPage(1);
			convertOptions.setPagesCount(2);
			convertOptions.setFixedLayout(true);

			settings.setConvertOptions(convertOptions);
			settings.setOutputPath("java-testing/output-sample-file.html");
			
			// converter para o formato especificado
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document conveted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Conversor Online Gratuito de Word para HTML

Como converter Word para arquivo HTML online gratuitamente? Por favor, tente online Word para HTML conversor para criar HTML a partir do documento do Word gratuitamente. Este conversor foi desenvolvido usando a API REST de Word para HTML mencionada acima.

Conclusão

Concluindo, a conversão de um documento do Word para HTML pode trazer muitos benefícios, como a publicação de conteúdo online ou a criação de um site, além de uma melhor otimização do mecanismo de pesquisa. Estamos completando o artigo aqui. O seguinte é o que você aprendeu neste artigo:

  • como alterar a página Word para HTML em Java programaticamente;
  • como converter um arquivo do Word em um arquivo HTML usando algumas configurações avançadas em Java;
  • carregar programaticamente o arquivo do Word para a nuvem e, em seguida, baixar o arquivo HTML convertido da nuvem;
  • e converta online Word para HTML usando o conversor gratuito de Word para HTML.

Além disso, também fornecemos uma seção Referência de API que permite visualizar e se comunicar com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github. Verifique o GroupDocs.Conversion Cloud SDK para Java Exemplos aqui. Além disso, recomendamos que você consulte nosso Guia de primeiros passos.

Por fim, continuamos escrevendo novos artigos de blog sobre diferentes conversões de formatos de arquivo usando a API REST. Portanto, entre em contato para atualizações regulares.

Faça uma pergunta

Para qualquer dúvida sobre a API do conversor de Word para HTML, sinta-se à vontade para nos contatar no suporte gratuito fórum.

perguntas frequentes

Como faço para converter Word para HTML em Java?

Siga este link para aprender o exemplo de código Java para converter arquivos do Word em páginas da Web em HTML, de forma rápida e fácil.

Posso converter Word para HTML em Java usando a API REST?

Sim, você pode alterar o documento do Word para HTML em Java. Em primeiro lugar, crie uma instância de ConvertApi, defina os valores de ConvertSettings e invoque o método convertDocument com ConvertDocumentRequest para converter o documento do Word em uma página da Web HTML.

Como converter Word para HTML online gratuitamente?

Online Word document to HTML converter permite que você converta Word para HTML de forma gratuita, rápida e fácil. Assim que a conversão online do arquivo DOC para HTML for concluída, você poderá baixar instantaneamente o arquivo HTML convertido em seu PC. Por favor, siga as instruções passo a passo fornecidas abaixo para a conversão:

  • Abra conversor gratuito de Word para HTML online
  • Clique dentro da área de soltar arquivo para carregar um arquivo do Word ou arraste e solte um arquivo do Word.
  • Clique no botão Converter agora, o conversor online gratuito de Word para HTML mudará o arquivo do Word para HTML.
  • O link de download do arquivo HTML de saída estará disponível instantaneamente após a conversão do arquivo do Word.

Como instalar o Word para a biblioteca HTML Java?

Você pode baixar o conversor de Word para HTML biblioteca Java para processar, manipular e criar HTML a partir de arquivos do Word em Java programaticamente. Siga as etapas mencionadas anteriormente para instalar a biblioteca Java.

Como converter Word DOC para HTML no Windows?

Visite este link para baixar o conversor offline de Word para HTML para Windows. Este conversor gratuito de Word para HTML pode ser usado para exportar Word para HTML no Windows rapidamente, com um único clique.

Veja também

Se você quiser aprender sobre os tópicos relacionados, recomendamos que você visite os seguintes artigos.