Como converter pdf para html sem perder a formatação

Como converter PDF para HTML programaticamente

PDF(Portable Document Format) é um formato de documento seguro que contém gráficos, texto, modelos 3D, imagens etc. O formato PDF é compactado e menor do que outros formatos de arquivo compartilháveis. HTML é uma linguagem de marcação leve de texto simples amplamente usada. É suportado por todos os navegadores e é rápido para carregar. PDF e HTML ambos os formatos de arquivo são bons para acessibilidade, mas HTML é geralmente muito melhor para fornecer informações via web. Então, neste artigo, vamos demonstrar como converter PDF para HTML Online em Node.js.

Os seguintes tópicos serão abordados neste artigo:

API REST de conversão de página HTML e SDK Node.js

Node.js SDK of GroupDocs.Conversion é uma biblioteca de conversão NodeJS online que permite fazer conversões de PDF para HTML online. É uma biblioteca independente de plataforma e solução de conversão de documentos. Ele permite que você converta perfeitamente seus documentos e imagens de qualquer formato de arquivo suportado para qualquer formato que você precisar. Você pode facilmente converter mais de 50 tipos de documentos e imagens, como Word, PowerPoint, Excel, PDF, HTML, CAD, imagens raster, etc. Ele também suporta .NET, Java, PHP, Ruby, Android e Python SDKs como seus membros da família de conversão de documentos para a Cloud API.

GroupDocs.Conversion Cloud pode ser instalado usando o seguinte comando no console Node.js:

npm install groupdocs-conversion-cloud

Em seguida, obtenha seu Client ID e Client Secret no dashboard antes de começar a seguir as etapas e os exemplos de código disponíveis. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:

# Importe o SDK do Node.js em seu aplicativo de nó de http://api.groupdocs.cloud
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// obtenha clientId e clientSecret em https://dashboard.groupdocs.cloud (é necessário registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Como converter PDF para formato HTML no Node.js usando a API REST

As etapas fornecidas abaixo permitirão que você converta arquivos PDF em HTML usando o Nodejs.

  1. Upload o arquivo PDF para a nuvem
  2. Converter arquivo PDF para o formato HTML
  3. Baixar o arquivo HTML convertido

Carregar o arquivo PDF

O exemplo de código a seguir pode ser usado para carregar o arquivo PDF na nuvem:

// abra o arquivo no IOStream da unidade do sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// ler arquivo
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // criar solicitação de upload de arquivo
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // subir arquivo
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

O arquivo PDF carregado está disponível na seção de arquivos do seu painel.

Converter PDF em documento HTML no Node.js

A conversão de PDF para HTML usando esta biblioteca Node.js é uma questão de algumas linhas de código-fonte. Você pode seguir as seguintes etapas e o trecho de código:

  • Crie uma instância do ConvertApi
  • Crie uma instância do ConvertSettings
  • Defina o nome do armazenamento e o caminho do arquivo PDF de entrada
  • Em seguida, atribua “html” ao formato
  • Agora, forneça o caminho do arquivo HTML de saída
  • Criar ConvertDocumentRequest com ConvertSettings
  • Finalmente, converta chamando o método convertDocument() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter PDF em HTML online no Nodejs usando a API REST:

// Como converter PDF para formato HTML em Node.js usando a API REST
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Criar solicitação de conversão de documento
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Baixe o arquivo convertido

O exemplo de código acima salvará o arquivo HTML convertido na nuvem. Agora você sabe como converter PDF em formato HTML usando Node.js. Em seguida, baixe o arquivo HTML usando o seguinte exemplo de código:

// construa FileApi para baixar o arquivo convertido
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// criar solicitação de download de arquivo
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// arquivo de download e tipo de resposta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // salve o arquivo no diretório do sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Converta páginas específicas de PDF em HTML em Node.js usando a API REST

Você pode seguir as etapas a seguir e o trecho de código para converter PDF em HTML em seu aplicativo Node.js com algumas configurações avançadas:

Por favor, siga os passos indicados abaixo:

  • Em primeiro lugar, crie uma instância do ConvertApi
  • Crie uma instância do ConvertSettings
  • Defina o nome do armazenamento e o caminho do arquivo PDF de entrada
  • Em seguida, atribua “html” ao formato
  • Crie uma instância da classe HtmlConvertOptions
  • Defina várias opções de conversão como fromPage, pagesCount, fixedLayout, etc.
  • Agora, forneça as opções de conversão de saída e o caminho do arquivo HTML
  • Criar ConvertDocumentRequest com ConvertSettings
  • Finalmente, converta chamando o método convertDocument() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter PDF em HTML no Node.js usando opções avançadas:

// Como converter páginas específicas de PDF em HTML em Node.js usando a API REST
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Criar solicitação de conversão de documento
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Conversor PDF para HTML Gratuito Online

Como alterar o formato PDF para HTML online gratuitamente? Tente o seguinte conversor de PDF para HTML online grátis. Este conversor online de PDF para HTML5 foi desenvolvido usando a API acima e pode converter rapidamente PDF para tabela HTML online.

Conclusão

Arquivos PDF e HTML são amplamente usados para armazenar e transmitir dados. Portanto, este artigo abordou como transformar PDF em formato HTML em aplicativos Node.js. Agora você sabe:

  • como converter PDF para o formato HTML em Node.js usando a API REST;
  • como converter páginas específicas de PDF para HTML em Node.js usando a API REST
  • conversor on-line gratuito de PDF para HTML on-line;

Além disso, você pode aprender mais sobre GroupDocs.Conversion Cloud API usando a documentação ou exemplos disponíveis no GitHub. Também fornecemos uma seção Referência de API onde você pode interagir com as APIs diretamente com seu navegador da web. Você pode dar uma olhada em nossa página do Guia de introdução.

Além disso, Groupdocs.cloud também mantém atualizações com novos tópicos. Portanto, mantenha-se atualizado com as informações mais atualizadas.

Faça uma pergunta

Você está convidado a fazer suas perguntas sobre o conversor de PDF para HTML Node.js através do nosso Fórum de Suporte Gratuito.

perguntas frequentes

Como faço para converter um PDF em HTML no Node.js?

Siga este link para aprender o trecho de código sobre como gerar PDF a partir de HTML usando javascript de forma rápida e conveniente.

Como gerar PDF a partir do HTML Node.js usando a API REST?

Crie uma instância de ConvertApi, defina os valores das configurações de conversão e invoque o método convertDocument com ConvertDocumentRequest para gerar PDF do arquivo HTML.

Como converter PDF para HTML online gratuitamente?

Conversor online gratuito de PDF para código HTML permite que você converta PDF para o formato de arquivo HTML, de forma rápida e fácil. Assim que a conversão estiver concluída, você pode baixar o arquivo HTML.

Como faço para converter um PDF em HTML offline?

Visite este link para baixar o software conversor de PDF para HTML gratuito no Windows. Este software de download gratuito de conversor de PDF para HTML online pode ser usado para transformar PDF em HTML no Windows rapidamente, com um único clique.

Veja também

Recomendamos que você leia os seguintes artigos para saber mais: