Pode ser necessário extrair várias páginas de PDF de uma vez por meio de programação. Ao separar páginas PDF, você pode facilmente exportar e salvar páginas específicas de documentos PDF para compartilhar com as partes interessadas. Como desenvolvedor Node.js, você pode extrair várias páginas de documentos PDF na nuvem. Neste artigo, vamos demonstrar como extrair páginas de um arquivo PDF usando Rest API em Node.js.
Os seguintes tópicos devem ser abordados neste artigo para tirar páginas do PDF:
- API REST do extrator de PDF e SDK Node.js
- Extrair páginas PDF por números de página exatos usando API REST em Node.js
- Extrair páginas de PDF por intervalo de páginas usando API REST em Node.js
API REST do extrator de PDF e SDK Node.js
Para extrair páginas de PDF adobe acrobat, usarei a API Node.js SDK of GroupDocs.Merger Cloud. É uma biblioteca de download gratuito do extrator de páginas PDF on-line. Ele permite que você divida, combine, extraia, remova e reorganize uma única página ou uma coleção de páginas de formatos de documento suportados de Word, Excel, PowerPoint, Desenhos do Visio, PDF e HTML.
Você pode instalar a nuvem GroupDocs.Merger para extrair páginas PDF de arquivos PDF em seu aplicativo Node.js usando o seguinte comando no console:
npm install groupdocs-merger-cloud
Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:
# Importe o SDK do Node.js em seu aplicativo de nó de http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");
// obtenha clientId e clientSecret em https://dashboard.groupdocs.cloud (é necessário registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";
Extraia páginas PDF por números de página exatos usando a API REST em Node.js
Você pode exportar uma única página de PDF ou exportar páginas específicas de arquivos PDF programaticamente na nuvem seguindo as etapas simples mencionadas abaixo:
- Carregar o arquivo PDF para a nuvem
- Extract Páginas PDF usando API REST em Node.js
- Baixar os arquivos separados
Carregar o arquivo PDF
Você pode começar importando o arquivo PDF para a nuvem usando o exemplo de código abaixo:
// abra o arquivo no IOStream da unidade do sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// ler arquivo
fs.readFile(resourcesFolder, (err, fileStream) => {
// construir FileApi
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// criar solicitação de upload de arquivo
var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
// subir arquivo
fileApi.uploadFile(request)
.then(function (response) {
console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
});
O arquivo PDF estará disponível quando o arquivo for carregado na seção de arquivos do seu painel na nuvem.
Extraia páginas PDF usando a API REST em Node.js
As etapas abaixo ensinam como extrair páginas de um arquivo PDF programaticamente:
- Em primeiro lugar, crie uma instância de PagesApi.
- Crie uma instância de ExtractOptions.
- Crie uma instância do FileInfo.
- Em seguida, defina o caminho para o arquivo PDF de entrada.
- Em seguida, defina o caminho para o arquivo PDF extraído.
- Defina números de página específicos em uma matriz separada por vírgulas para extrair arquivos PDF.
- Crie ExtractRequest com ExtractOptions.
- Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.
O trecho de código a seguir mostra como extrair páginas PDF em arquivos separados usando a API REST no Node.js:
// Como extrair páginas PDF por números de página exatos usando a API REST no Node.js
const extractpdfpages = async () => {
// inicialização da API
global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);
// definir opções de extração
let options = new groupdocs_merger_cloud.ExtractOptions();
options.fileInfo = new groupdocs_merger_cloud.FileInfo();
options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf";
options.outputPath = "nodejs-testing/output-sample-file.pdf";
options.pages = [2, 4, 7];
try {
// criar solicitação de extração
let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
// extrair páginas de documento pdf
let result = await pagesApi.extract(extractRequest);
}
catch (err) {
throw err;
}
}
extractpdfpages()
.then(() => {
console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
console.log("Error occurred while extracting pages from PDF file:", err);
})
Baixe os arquivos extraídos
O exemplo de código acima salvará os arquivos separados na nuvem. Você pode baixá-los usando o seguinte exemplo de código:
// construir FileApi para baixar o arquivo mesclado
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// criar solicitação de download de arquivo
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// arquivo de download e tipo de resposta Stream
fileApi.downloadFile(request)
.then(function (response) {
// salve o arquivo no diretório do sistema
fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
console.log("Expected response type is Stream: " + response.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
Extrair páginas de PDF por intervalo de páginas usando API REST em Node.js
Você pode extrair e salvar páginas de um PDF separadamente, fornecendo um intervalo de números de página programaticamente seguindo as etapas abaixo:
- Em primeiro lugar, crie uma instância de PagesApi.
- Crie uma instância de ExtractOptions.
- Crie uma instância do FileInfo.
- Em seguida, defina o caminho para o arquivo PDF de entrada.
- Em seguida, defina o caminho para o arquivo PDF extraído.
- Defina o número da página inicial e os valores do número da página final.
- Em seguida, defina o rangeMode como EvenPages ou OddPages
- Crie ExtractRequest com ExtractOptions.
- Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.
O trecho de código a seguir mostra como extrair páginas de PDF online usando o intervalo de páginas e o modo de página no Node.js:
// Como extrair páginas de PDF por intervalo de páginas usando API REST em Node.js
const extractpages = async () => {
// inicialização da API
global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);
// definir opções de extração
let options = new groupdocs_merger_cloud.ExtractOptions();
options.fileInfo = new groupdocs_merger_cloud.FileInfo();
options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf";
options.outputPath = "nodejs-testing/output-sample-file.pdf";
options.startPageNumber = 1;
options.endPageNumber = 10;
options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
try {
// criar solicitação de extração
let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
// extrair páginas de arquivo PDF
let result = await pagesApi.extract(extractRequest);
}
catch (err) {
throw err;
}
}
extractpages()
.then(() => {
console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
console.log("Error occurred while extracting pages from PDF file.", err);
})
Da mesma forma, você pode extrair páginas ímpares de documentos PDF.
Experimente on-line
Como extrair páginas de arquivos PDF online? Tente a seguinte ferramenta de extração de PDF on-line gratuita para extrair páginas de PDF on-line gratuitamente. Esta ferramenta on-line gratuita do extrator de páginas PDF foi desenvolvida usando a API acima.
Conclusão
Estamos encerrando este post aqui no blog. Neste artigo, você aprendeu:
- como extrair certas páginas de PDF ou extrair uma página de PDF online usando REST API;
- como extrair páginas de documentos PDF usando intervalo de páginas e filtro de modo de intervalo;
- carregue o arquivo PDF para a nuvem para exportar as páginas selecionadas do PDF online;
- baixe e salve determinadas páginas de PDF da nuvem;
- como extrair páginas de PDF grátis;
Agora você sabe como extrair uma página de um documento PDF ou como salvar determinadas páginas de um PDF. A API também permite que você reordene ou substitua páginas de documentos, altere a orientação da página, gerencie senhas de documentos e execute outras manipulações facilmente para qualquer formato de arquivo compatível. Além disso, você pode aprender mais sobre GroupDocs.Merge Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador.
Além disso, recomendamos que você consulte nosso Guia de primeiros passos.
Além disso, groupdocs.cloud escreve regularmente artigos sobre novos tópicos. Então, por favor, fique em contato para as últimas atualizações.
Faça uma pergunta
Você pode fazer suas perguntas sobre como extrair arquivos PDF para exportar páginas selecionadas do PDF, através do nosso Fórum de Suporte Gratuito
perguntas frequentes
Como extrair várias páginas de PDF em um arquivo?
Instale a biblioteca JS para separar arquivos PDF em várias páginas online de forma programática. Você pode visitar a documentação para obter detalhes completos da API.
Quanto tempo leva para extrair páginas específicas do PDF?
JavaScript HTML to PDF library funciona muito rápido e você pode extrair páginas de PDF protegido facilmente em alguns segundos.
Veja também
Para uma melhor leitura e informação, visite os seguintes artigos:
- Junte arquivos PDF no One Online usando Node.js
- Extrair páginas de documentos do Word em Python
- Combine várias apresentações do PowerPoint em uma
- Mesclar arquivos PDF usando uma API REST
- Como combinar arquivos PowerPoint PPT/PPTX em Python
- Combine vários documentos do Word usando Python
- Dividir documento do Word em vários arquivos usando Node.js
- Como dividir slides PowerPoint PPT ou PPTX em Python
- Como extrair páginas de documentos do Word em Python
- Mesclar arquivos PowerPoint PPT/PPTX online usando REST API em Ruby
- Como combinar vários documentos do Word usando Python
- Combinar e mesclar arquivos PPT/PPTX do PowerPoint em Python
- Extrair imagens de arquivos PDF usando Node.js
- Como dividir documentos do Word em arquivos separados usando Node.js