Como extrair páginas de um arquivo PDF usando a API Rest no Node.js

Como extrair páginas de arquivos PDF usando a API Rest no Node.js

Pode ser necessário extrair várias páginas de PDF de uma vez por meio de programação. Ao separar páginas PDF, você pode facilmente exportar e salvar páginas específicas de documentos PDF para compartilhar com as partes interessadas. Como desenvolvedor Node.js, você pode extrair várias páginas de documentos PDF na nuvem. Neste artigo, vamos demonstrar como extrair páginas de um arquivo PDF usando Rest API em Node.js.

Os seguintes tópicos devem ser abordados neste artigo para tirar páginas do PDF:

API REST do extrator de PDF e SDK Node.js

Para extrair páginas de PDF adobe acrobat, usarei a API Node.js SDK of GroupDocs.Merger Cloud. É uma biblioteca de download gratuito do extrator de páginas PDF on-line. Ele permite que você divida, combine, extraia, remova e reorganize uma única página ou uma coleção de páginas de formatos de documento suportados de Word, Excel, PowerPoint, Desenhos do Visio, PDF e HTML.

Você pode instalar a nuvem GroupDocs.Merger para extrair páginas PDF de arquivos PDF em seu aplicativo Node.js usando o seguinte comando no console:

npm install groupdocs-merger-cloud

Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:

# Importe o SDK do Node.js em seu aplicativo de nó de http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// obtenha clientId e clientSecret em https://dashboard.groupdocs.cloud (é necessário registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extraia páginas PDF por números de página exatos usando a API REST em Node.js

Você pode exportar uma única página de PDF ou exportar páginas específicas de arquivos PDF programaticamente na nuvem seguindo as etapas simples mencionadas abaixo:

  • Carregar o arquivo PDF para a nuvem
  • Extract Páginas PDF usando API REST em Node.js
  • Baixar os arquivos separados

Carregar o arquivo PDF

Você pode começar importando o arquivo PDF para a nuvem usando o exemplo de código abaixo:

// abra o arquivo no IOStream da unidade do sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// ler arquivo
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // criar solicitação de upload de arquivo
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // subir arquivo
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

O arquivo PDF estará disponível quando o arquivo for carregado na seção de arquivos do seu painel na nuvem.

Extraia páginas PDF usando a API REST em Node.js

As etapas abaixo ensinam como extrair páginas de um arquivo PDF programaticamente:

  • Em primeiro lugar, crie uma instância de PagesApi.
  • Crie uma instância de ExtractOptions.
  • Crie uma instância do FileInfo.
  • Em seguida, defina o caminho para o arquivo PDF de entrada.
  • Em seguida, defina o caminho para o arquivo PDF extraído.
  • Defina números de página específicos em uma matriz separada por vírgulas para extrair arquivos PDF.
  • Crie ExtractRequest com ExtractOptions.
  • Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.

O trecho de código a seguir mostra como extrair páginas PDF em arquivos separados usando a API REST no Node.js:

// Como extrair páginas PDF por números de página exatos usando a API REST no Node.js
const extractpdfpages = async () => {

  // inicialização da API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opções de extração
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // criar solicitação de extração
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extrair páginas de documento pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Baixe os arquivos extraídos

O exemplo de código acima salvará os arquivos separados na nuvem. Você pode baixá-los usando o seguinte exemplo de código:

// construir FileApi para baixar o arquivo mesclado
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// criar solicitação de download de arquivo
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// arquivo de download e tipo de resposta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // salve o arquivo no diretório do sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extrair páginas de PDF por intervalo de páginas usando API REST em Node.js

Você pode extrair e salvar páginas de um PDF separadamente, fornecendo um intervalo de números de página programaticamente seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância de PagesApi.
  • Crie uma instância de ExtractOptions.
  • Crie uma instância do FileInfo.
  • Em seguida, defina o caminho para o arquivo PDF de entrada.
  • Em seguida, defina o caminho para o arquivo PDF extraído.
  • Defina o número da página inicial e os valores do número da página final.
  • Em seguida, defina o rangeMode como EvenPages ou OddPages
  • Crie ExtractRequest com ExtractOptions.
  • Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.

O trecho de código a seguir mostra como extrair páginas de PDF online usando o intervalo de páginas e o modo de página no Node.js:

// Como extrair páginas de PDF por intervalo de páginas usando API REST em Node.js
const extractpages = async () => {

  // inicialização da API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opções de extração
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // criar solicitação de extração
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extrair páginas de arquivo PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

Da mesma forma, você pode extrair páginas ímpares de documentos PDF.

Experimente on-line

Como extrair páginas de arquivos PDF online? Tente a seguinte ferramenta de extração de PDF on-line gratuita para extrair páginas de PDF on-line gratuitamente. Esta ferramenta on-line gratuita do extrator de páginas PDF foi desenvolvida usando a API acima.

Conclusão

Estamos encerrando este post aqui no blog. Neste artigo, você aprendeu:

  • como extrair certas páginas de PDF ou extrair uma página de PDF online usando REST API;
  • como extrair páginas de documentos PDF usando intervalo de páginas e filtro de modo de intervalo;
  • carregue o arquivo PDF para a nuvem para exportar as páginas selecionadas do PDF online;
  • baixe e salve determinadas páginas de PDF da nuvem;
  • como extrair páginas de PDF grátis;

Agora você sabe como extrair uma página de um documento PDF ou como salvar determinadas páginas de um PDF. A API também permite que você reordene ou substitua páginas de documentos, altere a orientação da página, gerencie senhas de documentos e execute outras manipulações facilmente para qualquer formato de arquivo compatível. Além disso, você pode aprender mais sobre GroupDocs.Merge Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador.

Além disso, recomendamos que você consulte nosso Guia de primeiros passos.

Além disso, groupdocs.cloud escreve regularmente artigos sobre novos tópicos. Então, por favor, fique em contato para as últimas atualizações.

Faça uma pergunta

Você pode fazer suas perguntas sobre como extrair arquivos PDF para exportar páginas selecionadas do PDF, através do nosso Fórum de Suporte Gratuito

perguntas frequentes

Como extrair várias páginas de PDF em um arquivo?

Instale a biblioteca JS para separar arquivos PDF em várias páginas online de forma programática. Você pode visitar a documentação para obter detalhes completos da API.

Quanto tempo leva para extrair páginas específicas do PDF?

JavaScript HTML to PDF library funciona muito rápido e você pode extrair páginas de PDF protegido facilmente em alguns segundos.

Veja também

Para uma melhor leitura e informação, visite os seguintes artigos: