Extrair Imagens de PDF em Node.js - Extrator de Imagens

Neste artigo, você aprenderá como extrair programaticamente imagens de PDF arquivos usando Node.js e a poderosa API REST Cloud do GroupDocs.Parser. Se você está construindo um analisador de conteúdo, ferramenta de extração de dados ou sistema de automação de documentos, a extração de imagens incorporadas de PDFs é um requisito comum. Este guia cobre a instalação, uso e trechos de código para uma fácil extração de imagens.

Por que extrair imagens de PDF?

  • Extraia logotipos, infográficos e fotos incorporadas de PDFs.
  • Automatize a digitalização de documentos para arquivamento e processamento de dados.
  • Construa analisadores de PDF personalizados ou pipelines de reconhecimento de imagem.
  • Fluxo de trabalho baseado em API REST — Sem necessidade de software de desktop.

Neste artigo, vamos abordar os seguintes tópicos:

API de Processamento de PDF

GroupDocs.Parser Cloud SDK for Node.js é um wrapper de API leve e fácil de integrar que permite aos desenvolvedores extrair conteúdo estruturado — como texto, imagens, metadados e campos de documentos — de uma ampla variedade de formatos de arquivo, incluindo PDF, Word, Excel e muito mais.

Requisitos pré-requisitos Instale o GroupDocs.Parser Cloud SDK para Node.js:

npm install groupdocs-parser-cloud

Crie uma conta no GroupDocs.Cloud Dashboard para obter seu ID do Cliente e Segredo do Cliente para autenticação. Para mais informações, visite este article.

Extrair Imagens de PDF usando Node.js

Siga estas etapas para desenvolver seu próprio extrator de imagem de PDF usando a API Node.js:

Passo 1: Configurar a Configuração.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Etapa 2: Defina as Informações do Arquivo PDF e as Opções de Extração de Imagem. Inicialize um objeto da classe ImagesRequest e passe a instância da classe ImagesOptions.

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Passo 3: Extrair Imagens. Invocar o images método para extrair imagens do arquivo PDF.

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Para mais exemplos, por favor visite https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

Você pode ver a saída do exemplo de código acima na imagem abaixo:

extrator de arquivo de imagem

Extrair Imagens de PDF via cURL

Você também pode extrair imagens usando a API REST do GroupDocs.Parser e cURL.

Passo 1 – Gerar Token de Acesso:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Passo 2 – Extrair Imagens via REST API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Substitua pelo que você gerou.

Extrator de Imagens Online

Se você está procurando uma solução sem código, pode usar o Extrator de Imagem PDF Online Grátis alimentado por GroupDocs.Parser Cloud.

Extrator de Imagens Online

Conclusão

O GroupDocs.Parser Cloud SDK para Node.js torna a extração de imagens de documentos PDF rápida, escalável e amigável ao código. Quer você esteja criando scripts de automação, rastreadores de conteúdo ou ferramentas de análises baseadas em imagens, esta API REST oferece tudo o que você precisa para isolar e exportar imagens programaticamente.

Pronto para integrá-lo ao seu fluxo de trabalho? Comece com sua primeira chamada de API hoje!

📚 Recursos Adicionais

Perguntas Frequentes – FAQs

Como extraio imagens do Word?

Você pode usar GroupDocs.Parser Cloud SDKs para extrair imagens de arquivos PDF programaticamente. Por favor, visite este link para mais detalhes.

Qual é o modelo de precificação?

Oferecemos um modelo de preços de pagamento único conforme o uso. Para mais informações, por favor visite pricing guide.

Artigos Relacionados