Parser de Documento Word – Extraia Imagens de Arquivo Word Online em Java

A análise de documentos é uma tarefa crucial em muitas indústrias onde a extração de dados de vários formatos de documentos é necessária. Ao trabalhar com Word documentos, a extração de imagens pode ser particularmente útil em casos como análise de conteúdo, reconhecimento de imagem ou visualização de dados. Extrair imagens manualmente de grandes documentos do Word pode ser demorado. Portanto, automatizar o processo de extração de imagens pode economizar tempo e esforço. Neste artigo, demonstraremos como extrair imagens de documentos do Word programaticamente em Java.

Os seguintes tópicos serão abordados neste artigo:

Java REST API para Extrair Imagens de Documentos do Word e Instalação do SDK

GroupDocs.Parser Cloud SDK for Java é uma poderosa biblioteca Java que oferece uma maneira simples e eficiente de analisar e extrair dados de vários formatos de documentos, incluindo documentos do Word. Ela oferece uma ampla gama de recursos para análise de documentos, permitindo que os desenvolvedores extraiam imagens, texto, metadados e muito mais. O GroupDocs.Parser também fornece SDKs em C#.NET, Java, PHP, Ruby e Python como seus membros da família de analisadores de documentos para as APIs em nuvem.

Para começar, você precisa incluir o GroupDocs.Parser Cloud SDK em seu projeto Java. Você pode download o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Em seguida, você precisa sign up para uma conta de avaliação gratuita ou purchase a subscription plan no site do GroupDocs e get your API key. Uma vez que você tenha o Client Id e o Client Secret, adicione o trecho de código abaixo a uma aplicação baseada em Java:

# Obtenha seu clientid e clientsecret em https://dashboard.groupdocs.cloud após o registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Como Extrair Todas as Imagens de Documentos do Word em Java usando REST API

Para extrair imagens de documentos Word em Java usando o GroupDocs.Parser Cloud SDK, siga estes passos e um exemplo de código:

  • Primeiro, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o documento Word de entrada.
  • Então, crie uma instância da classe ImagesOptions().
  • Em seguida, atribua fileInfo à opção de imagem setFileInfo.
  • Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
  • Por fim, obtenha resultados chamando o ParseApi.images() método e passando o parâmetro ImagesRequest.

O seguinte exemplo de código mostra como extrair todas as imagens de um documento do Word online em Java usando REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// How to extract images from a Word document in Java.
public class App {

	public static void main(String[] args) {
		
		// Criar uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrair Imagens Específicas de Arquivo Word em Java Usando Número da Página

Nesta seção, escreveremos etapas e um exemplo de código para extrair imagens específicas de um documento Word programaticamente em Java:

  • Primeiro, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o arquivo Word como entrada.
  • Então, crie uma instância da classe ImagesOptions().
  • Em seguida, atribua fileInfo à opção de imagem setFileInfo.
  • Então, forneça os valores de setStartPageNumber e setCountPagesToExtract.
  • Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
  • Finalmente, obtenha resultados chamando o ParseApi.images() método e passando o parâmetro ImagesRequest.

O seguinte exemplo de código mostra como extrair imagens específicas de um arquivo Word por intervalo de páginas em Java usando REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extrair imagens de um arquivo Word online por faixa de página em Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare os ajustes
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrator de Imagens Online Grátis

Qual é a melhor maneira de extrair imagens do Word online gratuitamente? Por favor, tente um parser de documento do Word online para extrair imagens do Word. Esta ferramenta de parser do Word foi desenvolvida usando a biblioteca de parser Java mencionada acima.

Conclusão

Em conclusão, o GroupDocs.Parser Cloud SDK é uma ótima solução para extrair imagens de documentos do Word, economizando tempo e esforço enquanto garante resultados precisos. O seguinte é o que você aprendeu com este artigo:

  • how to extract all images from Word DOCX programmatically in Java using REST API;
  • how to extract specific images from Word documents in Java using REST API;
  • e uma ferramenta de extração de imagem online para extrair imagens de documentos do Word.

Além disso, você pode aprender mais sobre a GroupDocs.Parser Cloud API usando a documentação. Também fornecemos uma seção de Referência de API que permite visualizar e interagir com nossas APIs diretamente através do navegador. O código-fonte completo do SDK Java está disponível gratuitamente no Github.

Finalmente, continuamos escrevendo novos artigos de blog sobre diferentes formatos de arquivo e analisando-os usando a REST API. Então, entre em contato para as últimas atualizações.

Ask a question

Caso você tenha alguma dúvida sobre como extrair imagens de documentos, sinta-se à vontade para nos contatar através do nosso forum.

FAQs

Como faço para analisar documentos do Word em Java?

Para extrair imagens ou texto, você primeiro precisa carregar e analisar o documento do Word usando GroupDocs.Parser Cloud SDK. Esse processo envolve especificar o caminho do arquivo e chamar o método Parse para analisar documentos.

O GroupDocs.Parser Cloud SDK pode extrair imagens de outros formatos de documento?

Sim, GroupDocs.Parser Cloud SDK for Java suporta a extração de imagens de vários formatos de documentos, incluindo Word, PDF, Excel, PowerPoint e muitos mais.

Can the GroupDocs.Parser Cloud SDK extract multiple images from a single Word document?

Sim, o SDK pode extrair várias imagens de um único documento do Word, fornecendo todas as imagens contidas dentro do documento.

O SDK GroupDocs.Parser Cloud preserva a qualidade original da imagem durante o processo de extração?

Sim, o GroupDocs.Parser Cloud SDK for Java preserva a qualidade original das imagens ao extrair imagens de documentos do Word.

Veja Também

Aqui estão alguns artigos relacionados que você pode achar úteis: