Como converter arquivo PDF para documento HTML em Java usando a API REST

Converta PDF para HTML em Java usando a API REST

Como desenvolvedor Java, você pode converter documentos PDF(Portable Document Format) programaticamente em páginas da Web HTML(Hypertext Markup Language) usando a API REST GroupDocs.Conversion. Em certos cenários, pode ser necessário converter PDF em arquivo HTML. Por exemplo, você precisa compartilhar documentos PDF em redes sociais ou publicar conteúdo PDF online na web. com HTML você pode usar formulários, links e outros elementos interativos e permite que o documento seja mais interativo. Então, neste artigo vou demonstrar como converter PDF para HTML em Java usando a API REST.

Os seguintes tópicos serão abordados neste tutorial:

Java PDF to HTML Converter REST API - Instalação do Java SDK

Para converter o arquivo PDF para o formato HTML, usarei o Java SDK do GroupDocs.Conversion Cloud API. Ele ajuda você a incluir GroupDocs. Serviços de conversão em nuvem em seus aplicativos Java de forma rápida e fácil. Esta é a melhor API de conversão de PDF para HTML que retém o formato de texto original e os layouts de seus documentos. As APIs de conversão do Groupdocs também permitem que você converta seus arquivos e imagens de qualquer formato de arquivo suportado para qualquer formato que você precisar. Você pode facilmente converter entre mais de 50 tipos de documentos e imagens como Word, PDF, PowerPoint, Excel, HTML, CAD, imagens raster, etc.

Você pode baixar o arquivo JAR da API ou instalar usando as configurações do Maven. Adicione o repositório e a dependência ao POM.xml do seu projeto. Abaixo estão as instruções para o Maven:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Obtenha seu ID e segredo do cliente no painel antes de começar a seguir as etapas e os exemplos de código disponíveis. Por favor, digite o código exibido abaixo depois de ter seu ID e segredo:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro gratuito.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Converter arquivo PDF em documento HTML em Java usando a API REST

A conversão de documentos PDF em páginas da Web HTML permite que você torne o conteúdo mais acessível, pesquisável, compatível, editável e compartilhável. A seguir estão as etapas para converter um documento PDF em HTML, conforme mencionado abaixo:

Carregar o arquivo

Em primeiro lugar, carregue o documento PDF para o armazenamento em nuvem usando o trecho de código fornecido abaixo:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Carregar arquivo para armazenamento em nuvem usando Java
public class App {

	public static void main(String[] args) {
				
		// Crie uma instância da API de conversão					
		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Como resultado, o arquivo PDF carregado estará disponível na seção de arquivos do seu painel na nuvem.

Converter PDF para HTML em Java

Esta seção mostra como converter programaticamente um arquivo PDF em uma página HTML sem perder a formatação seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância de ConvertApi
  • Em segundo lugar, crie uma instância do ConvertSettings
  • Em terceiro lugar, forneça o nome do armazenamento em nuvem
  • Defina o caminho do arquivo PDF de entrada e o formato do arquivo de saída como “html”
  • Agora, defina o caminho do arquivo HTML de saída
  • Criar ConvertDocumentRequest com ConvertSettings
  • Finalmente, chame o método convertdocument() com ConvertDocumentRequest

O trecho de código a seguir mostra como alterar o arquivo PDF para o formato HTML online usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Como converter PDF para arquivo HTML em Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API de conversão
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Preparar configurações de conversão
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			settings.setOutputPath("java-testing/output-sample-file.html");
		
			// converter para o formato especificado
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document converted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Baixe o arquivo convertido

O exemplo de código acima salvará a página do arquivo HTML convertido na nuvem. Você pode baixá-lo usando o seguinte trecho de código:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Baixe o arquivo do armazenamento em nuvem em Java
public class App {

	public static void main(String[] args) {
				
		// Crie uma instância da API de conversão					
		FileApi apiInstance = new FileApi(configuration);
		try {
			DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.html", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.err.println("Expected response type is File: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

É assim que a biblioteca do conversor de PDF para HTML em java funciona. Na próxima seção, vamos explorar configurações de conversão mais avançadas usando a API Java.

Converter PDF em página HTML em Java usando opções avançadas

Nesta seção, você aprenderá como converter arquivo PDF em documento HTML usando algumas opções avançadas programaticamente, seguindo as etapas e o trecho de código mostrado abaixo:

  • Primeiramente, crie uma instância da classe ConvertApi
  • Crie uma instância da classe ConvertSettings
  • Em seguida, forneça o nome do armazenamento em nuvem
  • Defina o caminho do arquivo PDF de entrada e o formato do arquivo de saída como “html”
  • Agora, crie uma instância da classe HtmlConvertOptions
  • Defina várias opções de conversão como setFromPage, setPagesCount, setFixedLayout, etc.
  • Em seguida, defina as opções de conversão e o caminho do arquivo de saída
  • Em seguida, crie ConvertDocumentRequest com ConvertSettings
  • Por fim, faça a conversão usando o método convertdocument() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter arquivo PDF em página HTML usando configurações avançadas.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Java converte arquivo PDF em página HTML usando opções adicionais.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API de conversão
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Preparar configurações de conversão
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			HtmlConvertOptions convertOptions = new HtmlConvertOptions();
			convertOptions.setFromPage(1);
			convertOptions.setPagesCount(2);
			convertOptions.setFixedLayout(true);

			settings.setConvertOptions(convertOptions);
			settings.setOutputPath("java-testing/output-sample-file.html");
			
			// converter para o formato especificado
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document conveted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Siga as etapas mencionadas anteriormente para fazer upload e download dos arquivos.

Conversor de PDF para HTML Online Gratuito

Como converter PDF para arquivo HTML online gratuitamente? Experimente o [conversor] de PDF para HTML online (https://products.groupdocs.app/conversion/pdf-to-html) para criar HTML a partir de PDF online gratuitamente. Ele foi desenvolvido usando a API acima para converter PDF para HTML online gratuitamente.

Conclusão

Isso nos leva ao final deste artigo. Neste artigo, aprendemos:

  • como transformar PDF em documento HTML em Java programaticamente;
  • como converter arquivo PDF em arquivo HTML usando algumas configurações avançadas em Java;
  • carregue programaticamente o arquivo PDF para a nuvem e, em seguida, baixe o arquivo HTML convertido da nuvem;
  • converter online PDF para HTML gratuitamente usando o software conversor de PDF para HTML;

Além disso, você pode aprender mais sobre a API de conversão de arquivos GroupDocs.Conversion usando a documentação. Também fornecemos uma seção Referência de API que permite que você visualize e se comunique com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github. Verifique o GroupDocs.Conversion Cloud SDK para Java Exemplos aqui.

Por fim, groupdocs.cloud está escrevendo novos artigos de blog sobre diferentes conversões de formatos de arquivo usando a API REST. Então, por favor, fique em contato para atualizações regulares.

Faça uma pergunta

Para qualquer dúvida/discussão sobre a API do conversor de PDF para HTML, sinta-se à vontade para nos contatar no suporte gratuito fórum.

perguntas frequentes

Como faço para converter PDF para HTML em Java?

Siga este link para aprender o trecho de código Java sobre como converter arquivo PDF em página HTML, de forma rápida e fácil.

Posso converter PDF para HTML em Java usando a API REST?

Sim, você pode alterar PDF para HTML em Java. Em primeiro lugar, crie uma instância de ConvertApi, defina os valores das configurações de conversão e invoque o método convertDocument com ConvertDocumentRequest para converter PDF em página da Web HTML.

Como converter PDF para HTML online gratuitamente?

Conversor PDF para HTML online grátis permite que você converta PDF para HTML grátis, de forma rápida e fácil. Assim que a conversão online de PDF para HTML for concluída, você poderá baixar instantaneamente o arquivo HTML convertido em seu PC.

Como faço para converter online PDF para HTML?

  • Abra conversor gratuito de PDF para HTML online
  • Clique dentro da área para soltar o arquivo para carregar o arquivo PDF ou arraste e solte o arquivo PDF.
  • Clique no botão Converter agora, o conversor online gratuito de PDF para HTML mudará o arquivo PDF para HTML online gratuitamente.
  • O link de download do arquivo HTML de saída estará disponível instantaneamente após a conversão do arquivo PDF em documento HTML gratuitamente.

Como instalar PDF para biblioteca HTML Java?

Você pode baixar e instalar a biblioteca do conversor de PDF para HTML Java para processar, manipular e criar HTML a partir de PDF em Java programaticamente.

Como converter PDF para HTML no Windows?

Visite este link para baixar o conversor de PDF para HTML offline para Windows. Este software de download gratuito conversor de PDF para HTML pode ser usado para exportar PDF para HTML no Windows rapidamente, com um único clique.

Veja também

Recomendamos que você visite os seguintes artigos para saber mais sobre: