Documentos do Word frequentemente contêm elementos visuais ricos, como logotipos, gráficos e imagens de produtos que você pode precisar reutilizar ou analisar separadamente. Salvar manualmente cada imagem de um .doc ou .docx pode ser lento e propenso a erros — especialmente ao lidar com documentos em massa ou fluxos de trabalho automatizados.

Portanto, neste artigo, vamos aprender os detalhes sobre como podemos extrair imagens programaticamente de documentos do Word usando algumas chamadas de API simples. Nosso SDK baseado em REST funciona inteiramente na nuvem — sem a necessidade do Microsoft Word ou bibliotecas externas — tornando-o ideal para automação, integração e aplicações escaláveis.

Características Salientes da Extração de Imagens

  • Arquivando visuais de documentos em uma biblioteca de mídia centralizada
  • Processando gráficos incorporados para fluxos de trabalho de aprendizado de máquina ou OCR
  • Reutilizando ativos da empresa de relatórios e contratos
  • Migrando dados visuais entre sistemas de documentos

Vamos explorar os seguintes tópicos em mais detalhes:

API de Processamento de Documentos do Word

O GroupDocs.Parser Cloud SDK para .NET é nossa API baseada em REST premiada, que oferece a capacidade de manipular uma grande variedade de formatos de arquivo, incluindo Documento do Word, PPTX, Excel, PDF, ZIP, etc. De acordo com nossos requisitos, a API simplifica esses casos de uso, permitindo que você leia, extraia e salve imagens diretamente de arquivos .doc e .docx em suas aplicações C#.

Pré-requisitos

  • Inscreva-se no GroupDocs Cloud Dashboard.
  • Obtenha seu Client ID e Client Secret. Para mais detalhes, visite este article.
  • Instale o SDK baseado em REST:
  • Instale .NET 6.0 ou posterior e o Visual Studio.

Instale o SDK a partir dos Pacotes NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
  • Para mais informações sobre credenciais de cliente,

Como Extrair Imagens do Word em C#

Siga o simples processo de três etapas abaixo para extrair imagens de um documento do Word usando C# e a API REST do GroupDocs.Parser Cloud.

Passo 1: Inicializar a Configuração da API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

Passo 2: Defina o Caminho do Arquivo e as Opções de Extração Inicialize um objeto do objeto ImagesRequest, onde passamos a instância da classe ImagesOptions como um argumento.

var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Passo 3: Recuperar Imagens do Documento. Invoque a images API para extrair imagens do documento do Word.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    // write the name of image extracted from word document
    Console.WriteLine($"Image found at: {image.Path}");
}
// Para mais informações, visite https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

// specify the input Word document information
var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// Criar objeto ImagesRequest
var request = new ImagesRequest(options);

// Chame a API para extrair imagens do documento do Word
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image found at: {image.Path}");
}

Baixar Imagens de Documentos Word Usando cURL

Se a sua preferência é a extração de imagem sem código, então tente chamar GroupDocs.Parser Cloud usando comandos cURL a partir do terminal de linha de comando ou arquivos em lote.

Passo 1 – Gerar Token de Acesso JWT:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Passo 2 – Extrair Imagens:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • Substitua pelo que você gerou.
  • Se você preferir extrair as imagens de todas as páginas, então ignore os parâmetros StartPageNumber e CountPagesToExtract.

Extrator de Imagens de Documentos Word Gratuito

Se você não tiver seu ambiente configurado e quiser testar as capacidades da API GroupDocs.Parser Cloud, então pode considerar experimentar nosso aplicativo gratuito online Word Image Extractor.

Free Images Extractor

Resumo

O SDK do GroupDocs.Parser Cloud para .NET é uma solução confiável para extração de conteúdo, análise de documentos e fluxos de trabalho de automação que envolvem Word, PDF, Excel e outros formatos. Experimente usar nossa API REST hoje!

Leitura Adicional

Perguntas Frequentes – FAQs

Posso extrair imagens de páginas específicas em um documento do Word?

  • Sim. Você pode definir os parâmetros StartPageNumber e CountPagesToExtract.

A API preserva a resolução das imagens?

  • Sim. A API retorna imagens incorporadas em qualidade e resolução semelhantes às que estavam incorporadas dentro do documento Word.

É necessário o Microsoft Word para realizar esta operação?

  • Não. Esta é uma solução baseada em nuvem e funciona independentemente do MS Office.

Há um teste gratuito?

  • Sim. Você pode obter 150 chamadas de API gratuitas por mês com uma conta de teste. Para mais informações, visite pricing guide.

Tutoriais Relacionados