A capacidade de converter documentos PDF para o formato HTML é essencial para diversos fins, como desenvolvimento web ou gerenciamento de conteúdo. Quer você seja um desenvolvedor que busca melhorar a acessibilidade do site ou um criador de conteúdo que busca redirecionar o conteúdo PDF para consumo on-line, dominar o processo de conversão de PDF em HTML usando C# .NET pode agilizar significativamente seu fluxo de trabalho e melhorar a eficiência. Neste artigo, exploraremos todos os detalhes da conversão de PDF em HTML usando a API .NET REST, cobrindo tudo, desde conceitos essenciais até técnicas avançadas.
Este artigo cobre os seguintes tópicos:
- API REST para conversão de PDF em HTML
- Converta PDF em HTML usando C# .NET
- Converta PDF em página da Web usando comandos cURL
API REST para conversão de PDF em HTML
GroupDocs.Conversion Cloud SDK for .NET fornece uma solução robusta e versátil para converter perfeitamente documentos PDF para o formato HTML. O SDK também oferece opções avançadas de personalização, permitindo especificar configurações de conversão, como intervalo de páginas, qualidade de imagem e estrutura do arquivo de saída, de acordo com seus requisitos específicos. Para utilizar o SDK, o primeiro passo é a sua instalação. Portanto, pesquise GroupDocs.Conversion-Cloud no gerenciador de pacotes NuGet e clique no botão Instalar. Outra opção é executar o seguinte comando no console do gerenciador de pacotes.
NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0
Depois que a API REST for instalada com êxito, certifique-se de ter as credenciais da API (ou seja, ID do cliente e segredo do cliente).Você pode visitar este breve tutorial para ver como obter as credenciais da API.
Converta PDF em HTML usando C# .NET
A seção a seguir explica os detalhes sobre como podemos aproveitar os poderosos recursos do Cloud SDK e automatizar programaticamente a tarefa de conversão de PDF em HTML, usando C# .NET.
- Crie uma instância da classe
Configuration
onde passamos as credenciais do cliente como argumentos.
var configurations = new Configuration(clientId, clientSecret1);
- Inicialize o
ConvertApi
onde passamos o objeto Configuration como argumento de entrada.
var apiInstance = new ConvertApi(configurations);
- Carregue o arquivo PDF de entrada para armazenamento em nuvem enquanto passa o nome do documento PDF de entrada.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
- Crie uma instância
ConvertSettings
onde especificamos o nome do PDF de entrada, o formato de saída comohtml
e o nome do arquivo HTML resultante.
var settings = new ConvertSettings{...}
- Chame a API ConvertDocumentRequest para converter PDF para o formato HTML. Após a conversão bem-sucedida, o HTML resultante é armazenado em armazenamento em nuvem.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Mais exemplos em https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Obtenha suas credenciais de API
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";
// Crie uma instância da classe Configuration e inicialize-a com o Client ID e o Client Secret.
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Defina o valor de ApiBaseUrl para definir o URL base da API do conversor de HTML para PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
// Inicialize uma instância da classe ConvertApi com o objeto da classe Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
// carregue o arquivo HTML da unidade local
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
// crie uma instância do FileApi
var fileUpload = new FileApi(configurations);
// carregue o arquivo PDF de entrada para armazenamento em nuvem
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
// crie ConvertSettings onde definimos o PDF de entrada e o nome do HTML resultante
var settings = new ConvertSettings
{
StorageName = "internal",
FilePath = "input.pdf",
Format = "html",
OutputPath = "resultant.html"
};
// Invoque o método ConvertDocument para converter PDF em HTML programaticamente.
var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
if (response != null && response.Equals("OK"))
{
// imprimir mensagem de sucesso
Console.WriteLine("The PDF file successfully converted to HTML !");
}
}
O arquivo PDF de amostra usado no exemplo acima pode ser baixado em input.pdf.
Converta PDF em página da Web usando comandos cURL
A conversão de PDF em HTML usando GroupDocs.Conversion Cloud e comandos cURL oferece uma solução conveniente e programável para automatizar tarefas de conversão de documentos. Um dos principais benefícios desta abordagem é a sua simplicidade e facilidade de integração em fluxos de trabalho e pipelines de automação existentes. Com apenas alguns comandos simples, você pode iniciar e gerenciar o processo de conversão sem a necessidade de códigos complexos ou bibliotecas adicionais.
A primeira etapa nesta abordagem é obter suas credenciais personalizadas (App Key e App SID) e gerar o token de acesso JWT. Assim que tivermos o token JWT, execute o seguinte comando cURL para transformar o PDF em formato HTML. O comando a seguir adiciona uma string de amostra como marca d’água, mas é opcional.
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"FilePath\": \"{sourceFile}\", \"Format\": \"html\", \"LoadOptions\": { \"Format\": \"pdf\" }, \"ConvertOptions\": { \"FromPage\": 1, \"PagesCount\": 3, \"Pages\": [ 1,2,3 ], \"WatermarkOptions\": { \"Text\": \"Hello World !\", \"FontName\": \"Arial\", \"FontSize\": 10, \"Bold\": true, \"Italic\": true, \"Color\": \"Yellow\", \"Width\": 0, \"Height\": 0, \"Top\": 0, \"Left\": 0, \"RotationAngle\": 20, \"Transparency\": .5, \"Background\": true, \"AutoAlign\": true } }, \"OutputPath\": \"{resultantFile}\"}" -v
Substitua sourceFile
pelo nome do arquivo PDF de entrada disponível no armazenamento em nuvem, resultantFile
pelo nome do formato HTML de saída a ser gerado e accessToken
pelo token JWT gerado acima. Após a conversão bem-sucedida, o arquivo resultante é armazenado no armazenamento em nuvem.
Caso queira salvar o HTML resultante na unidade local, use o seguinte comando.
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"FilePath\": \"{sourceFile}\", \"Format\": \"html\", \"LoadOptions\": { \"Format\": \"pdf\" }, \"ConvertOptions\": { \"FromPage\": 1, \"PagesCount\": 3, \"Pages\": [ 1,2,3 ], \"WatermarkOptions\": { \"Text\": \"Hello World !\", \"FontName\": \"Arial\", \"FontSize\": 10, \"Bold\": true, \"Italic\": true, \"Color\": \"Yellow\", \"Width\": 0, \"Height\": 0, \"Top\": 0, \"Left\": 0, \"RotationAngle\": 20, \"Transparency\": .5, \"Background\": true, \"AutoAlign\": true } } }" \
-o "resultant.html"
Aplicativo gratuito de conversão de PDF para HTML
Você pode considerar usar nosso Conversor de PDF para HTML gratuito, leve e supereficiente, desenvolvido com base na API GroupDocs.Conversion.
Links Úteis
Conclusão
Concluindo, quer você opte por utilizar o GroupDocs.Conversion Cloud SDK para .NET ou integrar o GroupDocs.Conversion Cloud com comandos cURL, a conversão de PDF em HTML se torna um processo contínuo e eficiente. Ambas as abordagens oferecem soluções versáteis para automatizar tarefas de conversão de documentos, permitindo que você preencha facilmente a lacuna entre os formatos PDF e HTML. No geral, quer você prefira a conveniência de um SDK ou a flexibilidade dos comandos cURL, ambas as abordagens permitem converter PDF em HTML com eficiência e otimizar seus fluxos de trabalho de processamento de documentos com confiança.
Artigos relacionados
É altamente recomendável visitar os seguintes links para saber mais sobre: