conversor de pdf para html

Desenvolver um conversor de PDF para HTML com Java REST API.

Converter PDF documentos para HTML formato é essencial para desenvolvimento web, gerenciamento de conteúdo e melhoria da acessibilidade. Seja para exibir documentos online ou reutilizar conteúdo para aplicações baseadas na web, converter PDF para HTML usando a API REST Java fornece uma solução simples e eficiente. Neste artigo, exploraremos o processo passo a passo de transformar arquivos PDF em formato HTML usando o GroupDocs.Conversion Cloud SDK para Java.

Este artigo aborda os seguintes tópicos:

API REST para Conversão de PDF para HTML

GroupDocs.Conversion Cloud SDK for Java oferece uma solução robusta e flexível para converter documentos PDF para o formato HTML com alta precisão. A API preserva a estrutura do documento, imagens e formatação, permitindo a personalização do intervalo de páginas, estrutura de saída e qualidade da imagem.

Instalação

Para instalar o GroupDocs.Conversion Cloud SDK para Java, adicione a seguinte dependência do Maven:

<repository>
    <id>repository.groupdocs.cloud</id>
    <name>repository.groupdocs.cloud</name>
    <url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>24.2.0</version>
</dependency>

Certifique-se de que você possui credenciais de API válidas (ID do Cliente e Segredo do Cliente).Siga este tutorial para obtê-los.

Converter PDF para HTML usando Java

Siga estes passos para automatizar a conversão de PDF para HTML em Java:

  1. Inicialize Configuration com as credenciais da API:
Configuration configuration = new Configuration(clientId, clientSecret);
  1. Crie uma instância de ConvertApi:
ConvertApi convertApi = new ConvertApi(configuration);
  1. Upload o arquivo PDF de entrada para o armazenamento em nuvem:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
  1. Crie uma instância da classe ConvertSettings onde definimos o nome do PDF de entrada, o formato de saída como html e o nome do arquivo resultante:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
  1. Realizar a conversão de PDF para PPT usando a classe ConvertDocumentRequest, onde passamos um objeto ConvertSettings como argumento:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// Mais exemplos em  https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Obtenha suas credenciais da API 
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";

// Crie uma instância da classe Configuration e inicialize-a com o Client ID e o Client Secret.
Configuration configuration = new Configuration(clientId, clientSecret);
// Defina a URL base da API para a operação de conversão de arquivo PDF para HTML.
configuration.setApiBaseUrl("https://api.groupdocs.cloud");

// Inicialize uma instância do ConvertApi com o objeto de Configuração.
ConvertApi convertApi = new ConvertApi(configuration);

ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
    
// Invocar a API ConvertDocument para conversão de PDF para HTML
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
    
// Check the response and print success message
if (response != null && response.equals("OK")) {
    System.out.println("The PDF to HTML file conversion completed successfully!");
}
free pdf to html online

Imagem:- Uma prévia da conversão de PDF para HTML.

Baixe o arquivo PDF de exemplo utilizado no exemplo acima de input.pdf.

Converter PDF para Página da Web usando comandos cURL

Para usuários da linha de comando, GroupDocs.Conversion Cloud API permite conversão de PDF para HTML via comandos cURL, tornando a automação tranquila.

  • Gerar token de acesso JWT com suas credenciais.
  • Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{finalOutput}\"}"

Substitua sourceFile, resultantFile e accessToken pelos valores reais.

  • Se você tiver a necessidade de salvar o arquivo HTML resultante no disco local, execute o seguinte comando cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "myFinaloutput.html"

Experimente nosso conversor de PDF para HTML gratuito

Use nosso PDF to HTML Converter para uma experiência de conversão online rápida e eficiente.

Conversor de PDF para PPT gratuito online

Conclusão

Seja utilizando o GroupDocs.Conversion Cloud SDK para Java ou comandos cURL, ambas as abordagens oferecem uma maneira rápida, precisa e flexível de converter PDF para HTML. Com processamento baseado em nuvem, alta personalização e uma API amigável para desenvolvedores, o GroupDocs.Conversion Cloud simplifica a conversão de documentos. Experimente nosso SDK Java hoje mesmo para uma automação de PDF para HTML perfeita!

Artigos Recomendados

Recomendamos fortemente explorar os seguintes artigos: