
Neste artigo, você aprenderá como extrair programaticamente imagens de PDF arquivos usando Node.js e a poderosa API REST Cloud do GroupDocs.Parser. Se você está construindo um analisador de conteúdo, ferramenta de extração de dados ou sistema de automação de documentos, a extração de imagens incorporadas de PDFs é um requisito comum. Este guia cobre a instalação, uso e trechos de código para uma fácil extração de imagens.
Por que extrair imagens de PDF?
- Extraia logotipos, infográficos e fotos incorporadas de PDFs.
- Automatize a digitalização de documentos para arquivamento e processamento de dados.
- Construa analisadores de PDF personalizados ou pipelines de reconhecimento de imagem.
- Fluxo de trabalho baseado em API REST — Sem necessidade de software de desktop.
Neste artigo, vamos abordar os seguintes tópicos:
- API de Processamento de PDF
- Extrair Imagens de PDF usando Node.js
- Extrair Imagens de PDF via cURL
- Extrator de Imagens Online
API de Processamento de PDF
GroupDocs.Parser Cloud SDK for Node.js é um wrapper de API leve e fácil de integrar que permite aos desenvolvedores extrair conteúdo estruturado — como texto, imagens, metadados e campos de documentos — de uma ampla variedade de formatos de arquivo, incluindo PDF, Word, Excel e muito mais.
Requisitos pré-requisitos Instale o GroupDocs.Parser Cloud SDK para Node.js:
npm install groupdocs-parser-cloud
Crie uma conta no GroupDocs.Cloud Dashboard para obter seu ID do Cliente e Segredo do Cliente para autenticação. Para mais informações, visite este article.
Extrair Imagens de PDF usando Node.js
Siga estas etapas para desenvolver seu próprio extrator de imagem de PDF usando a API Node.js:
Passo 1: Configurar a Configuração.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Etapa 2: Defina as Informações do Arquivo PDF e as Opções de Extração de Imagem. Inicialize um objeto da classe ImagesRequest e passe a instância da classe ImagesOptions.
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Passo 3: Extrair Imagens. Invocar o images método para extrair imagens do arquivo PDF.
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// Para mais exemplos, por favor visite https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
Você pode ver a saída do exemplo de código acima na imagem abaixo:

Extrair Imagens de PDF via cURL
Você também pode extrair imagens usando a API REST do GroupDocs.Parser e cURL.
Passo 1 – Gerar Token de Acesso:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Passo 2 – Extrair Imagens via REST API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- Substitua pelo que você gerou.
Extrator de Imagens Online
Se você está procurando uma solução sem código, pode usar o Extrator de Imagem PDF Online Grátis alimentado por GroupDocs.Parser Cloud.

Conclusão
O GroupDocs.Parser Cloud SDK para Node.js torna a extração de imagens de documentos PDF rápida, escalável e amigável ao código. Quer você esteja criando scripts de automação, rastreadores de conteúdo ou ferramentas de análises baseadas em imagens, esta API REST oferece tudo o que você precisa para isolar e exportar imagens programaticamente.
Pronto para integrá-lo ao seu fluxo de trabalho? Comece com sua primeira chamada de API hoje!
📚 Recursos Adicionais
Perguntas Frequentes – FAQs
Como extraio imagens do Word?
Você pode usar GroupDocs.Parser Cloud SDKs para extrair imagens de arquivos PDF programaticamente. Por favor, visite este link para mais detalhes.
Qual é o modelo de precificação?
Oferecemos um modelo de preços de pagamento único conforme o uso. Para mais informações, por favor visite pricing guide.