PDF para HTML

Desenvolva um conversor de PDF para HTML com C# .NET.

A capacidade de converter documentos PDF para o formato HTML é essencial para diversos fins, como desenvolvimento web ou gerenciamento de conteúdo. Quer você seja um desenvolvedor que busca melhorar a acessibilidade do site ou um criador de conteúdo que busca redirecionar o conteúdo PDF para consumo on-line, dominar o processo de conversão de PDF em HTML usando C# .NET pode agilizar significativamente seu fluxo de trabalho e melhorar a eficiência. Neste artigo, exploraremos todos os detalhes da conversão de PDF em HTML usando a API .NET REST, cobrindo tudo, desde conceitos essenciais até técnicas avançadas.

Este artigo cobre os seguintes tópicos:

API REST para conversão de PDF em HTML

GroupDocs.Conversion Cloud SDK for .NET fornece uma solução robusta e versátil para converter perfeitamente documentos PDF para o formato HTML. O SDK também oferece opções avançadas de personalização, permitindo especificar configurações de conversão, como intervalo de páginas, qualidade de imagem e estrutura do arquivo de saída, de acordo com seus requisitos específicos. Para utilizar o SDK, o primeiro passo é a sua instalação. Portanto, pesquise GroupDocs.Conversion-Cloud no gerenciador de pacotes NuGet e clique no botão Instalar. Outra opção é executar o seguinte comando no console do gerenciador de pacotes.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Depois que a API REST for instalada com êxito, certifique-se de ter as credenciais da API (ou seja, ID do cliente e segredo do cliente).Você pode visitar este breve tutorial para ver como obter as credenciais da API.

Converta PDF em HTML usando C# .NET

A seção a seguir explica os detalhes sobre como podemos aproveitar os poderosos recursos do Cloud SDK e automatizar programaticamente a tarefa de conversão de PDF em HTML, usando C# .NET.

  1. Crie uma instância da classe Configuration onde passamos as credenciais do cliente como argumentos.
var configurations = new Configuration(clientId, clientSecret1);
  1. Inicialize o ConvertApi onde passamos o objeto Configuration como argumento de entrada.
var apiInstance = new ConvertApi(configurations);
  1. Carregue o arquivo PDF de entrada para armazenamento em nuvem enquanto passa o nome do documento PDF de entrada.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Crie uma instância ConvertSettings onde especificamos o nome do PDF de entrada, o formato de saída como html e o nome do arquivo HTML resultante.
var settings = new ConvertSettings{...}
  1. Chame a API ConvertDocumentRequest para converter PDF para o formato HTML. Após a conversão bem-sucedida, o HTML resultante é armazenado em armazenamento em nuvem.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Mais exemplos em https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Obtenha suas credenciais de API 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Crie uma instância da classe Configuration e inicialize-a com o Client ID e o Client Secret. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Defina o valor de ApiBaseUrl para definir o URL base da API do conversor de HTML para PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Inicialize uma instância da classe ConvertApi com o objeto da classe Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// carregue o arquivo HTML da unidade local             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // crie uma instância do FileApi
    var fileUpload = new FileApi(configurations);
    // carregue o arquivo PDF de entrada para armazenamento em nuvem
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // crie ConvertSettings onde definimos o PDF de entrada e o nome do HTML resultante
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Invoque o método ConvertDocument para converter PDF em HTML programaticamente.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // imprimir mensagem de sucesso
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF para HTML.

Imagem: - Visualização da conversão de PDF para HTML.

O arquivo PDF de amostra usado no exemplo acima pode ser baixado em input.pdf.

Converta PDF em página da Web usando comandos cURL

A conversão de PDF em HTML usando GroupDocs.Conversion Cloud e comandos cURL oferece uma solução conveniente e programável para automatizar tarefas de conversão de documentos. Um dos principais benefícios desta abordagem é a sua simplicidade e facilidade de integração em fluxos de trabalho e pipelines de automação existentes. Com apenas alguns comandos simples, você pode iniciar e gerenciar o processo de conversão sem a necessidade de códigos complexos ou bibliotecas adicionais.

A primeira etapa nesta abordagem é obter suas credenciais personalizadas (App Key e App SID) e gerar o token de acesso JWT. Assim que tivermos o token JWT, execute o seguinte comando cURL para transformar o PDF em formato HTML. O comando a seguir adiciona uma string de amostra como marca d’água, mas é opcional.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Substitua sourceFile pelo nome do arquivo PDF de entrada disponível no armazenamento em nuvem, resultantFile pelo nome do formato HTML de saída a ser gerado e accessToken pelo token JWT gerado acima. Após a conversão bem-sucedida, o arquivo resultante é armazenado no armazenamento em nuvem.

Caso queira salvar o HTML resultante na unidade local, use o seguinte comando.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Aplicativo gratuito de conversão de PDF para HTML

Você pode considerar usar nosso Conversor de PDF para HTML gratuito, leve e supereficiente, desenvolvido com base na API GroupDocs.Conversion.

aplicativo gratuito de pdf para html

Conclusão

Concluindo, quer você opte por utilizar o GroupDocs.Conversion Cloud SDK para .NET ou integrar o GroupDocs.Conversion Cloud com comandos cURL, a conversão de PDF em HTML se torna um processo contínuo e eficiente. Ambas as abordagens oferecem soluções versáteis para automatizar tarefas de conversão de documentos, permitindo que você preencha facilmente a lacuna entre os formatos PDF e HTML. No geral, quer você prefira a conveniência de um SDK ou a flexibilidade dos comandos cURL, ambas as abordagens permitem converter PDF em HTML com eficiência e otimizar seus fluxos de trabalho de processamento de documentos com confiança.

Artigos relacionados

É altamente recomendável visitar os seguintes links para saber mais sobre: