
Se você tem a necessidade de extrair imagens incorporadas de documentos do Word para arquivamento, automação ou reconhecimento de imagem? Então, nossa API REST em Node.js oferece uma solução robusta e baseada em nuvem para extrair imagens de .doc e .docx arquivos sem precisar que o Microsoft Word esteja instalado.
A necessidade de extração de imagem pode ocorrer se precisarmos de:
- Capture gráficos, gráficos e fotos incorporados em relatórios.
- Automatizar a extração de documentos ou modelos digitalizados.
- Construa conjuntos de dados de imagens a partir de repositórios de documentos.
- Pré-processar conteúdo para tarefas de OCR ou IA.
Vamos explorar os seguintes tópicos com mais detalhes:
- API de Extração de Imagens de Documentos Word
- Como Extrair Imagens do Word usando Node.js
- Extrair Imagens do Word via cURL
- Experimente o Extrator de Imagem de Texto Online gratuito
API de Extração de Imagem de Documentos Word
O GroupDocs.Parser Cloud SDK para Node.js é uma solução baseada em REST que oferece as capacidades para analisar documentos do MS Word para manipulação de conteúdo. Não apenas documentos do Word, mas também oferece suporte para extração de conteúdo de quase todos os formatos comuns de documentos comerciais, incluindo (PPTX, Excel, PDF, ZIP, etc.).
Pré-requisitos
- Inscreva-se em GroupDocs Cloud Dashboard.
- Obtenha seu Client ID e Client Secret.
- Instale o SDK baseado em REST:
npm install groupdocs-parser-cloud
- Para mais informações sobre credenciais de cliente, por favor visite este article.
Como Extrair Imagens do Word usando Node.js
Siga estas etapas para desenvolver uma aplicação simples e robusta para extrair imagens de Documentos MS Word usando a API Node.js:
Passo 1: Inicializar Configuração.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Passo 2: Configurar Informações do Arquivo e Opções de Imagem. Inicialize um objeto da classe ImagesRequest e passe a instância da classe ImagesOptions.
const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Passo 3: Extrair Imagens do Documento do Word. Invocar o images método para extrair imagens de documentos do Word online.
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// Para mais exemplos, por favor visite https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// caminho do documento do Word
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch(err => {
console.error("Failed to extract images:", err);
});
Você pode ver a saída do exemplo de código acima na imagem abaixo:

Extrair Imagens do Word via cURL
Se você prefere a abordagem de linha de comando para extrair imagens de documentos do Word usando comandos cURL, então GroupDocs.Parser Cloud suporta essas capacidades. Vamos explorar mais este recurso para simplificar a necessidade de como obter imagens de um documento do Word usando comandos cURL.
Passo 1 – Gerar Token de Acesso:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Passo 2 – Extrair Imagens do Arquivo Word:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 🔐 Substitua pelo que você gerou.
- Caso você precise extrair as imagens de todo o documento, simplesmente ignore os parâmetros
StartPageNumber
eCountPagesToExtract
.
Experimente o Extrator de Imagens de Palavras Grátis Online
Se você prefere uma abordagem baseada em UI para extrair as imagens do documento Word, então pode considerar usar nosso extrator de imagens de documento Word online gratuito Word Document Image Extractor alimentado pelo GroupDocs.Parser Cloud.

Conclusão
Com o GroupDocs.Parser Cloud SDK para Node.js, extrair imagens de arquivos Word se torna rápido e escalável. Se você precisa processar contratos, relatórios ou formulários digitalizados — esta API oferece total controle sobre a extração de imagens de documentos Word.
📚 Recursos Adicionais
Perguntas Frequentes – FAQs
Can I extract images from specific pages in a Word document?
- Sim. Você pode definir os parâmetros
StartPageNumber
eCountPagesToExtract
.
As imagens são extraídas no formato e resolução originais?
- Sim. A API retorna imagens incorporadas como estão no documento.
Do I need Microsoft Word installed?
- Não. Esta é uma solução baseada em nuvem e funciona de forma independente do MS Office.
Há um teste gratuito?
- Sim. Você pode obter 150 chamadas de API gratuitas por mês com uma conta de teste. Para mais informações, visite pricing guide.