Analisador de arquivos PDF – Extraia imagens de arquivos PDF online em Java

PDF(Portable Document Format) é um formato de arquivo amplamente usado para compartilhar e preservar documentos online. Geralmente contém vários tipos de conteúdo, incluindo texto, imagens, tabelas e muito mais. Extrair conteúdo específico de arquivos PDF, como imagens, pode ser uma tarefa desafiadora sem ferramentas confiáveis ou uma biblioteca. Uma dessas ferramentas é o GroupDocs.Parser Cloud SDK para Java, que fornece uma maneira simples e eficiente de extrair imagens de arquivos PDF. Neste artigo, demonstraremos como extrair imagens de arquivos PDF em Java usando a API REST.

Os seguintes tópicos serão abordados neste artigo:

Java REST API para separar imagens de instalação de PDF e SDK

GroupDocs.Parser Cloud SDK for Java é uma biblioteca Java poderosa e versátil que fornece uma maneira simples e eficiente de analisar e extrair dados de vários formatos de documento, incluindo arquivos PDF. Ele oferece uma ampla gama de recursos para análise de documentos, permitindo que os desenvolvedores extraiam imagens, texto, metadados e outros conteúdos. GroupDocs.Parser também fornece SDKs C#.NET, Java, PHP, Ruby e Python como seus membros da família de analisadores de documentos para APIs de nuvem.

Para começar, você precisa incluir o GroupDocs.Parser Cloud SDK em seu projeto Java. Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Em seguida, você precisa inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs e obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Java:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Como extrair todas as imagens de arquivos PDF em Java usando a API REST

Agora, vamos escrever as etapas e um trecho de código de exemplo para extrair imagens de arquivos PDF usando GroupDocs.Parser Cloud SDK for Java:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o documento PDF de entrada.
  • Em seguida, crie uma instância da classe ImagesOptions().
  • Em seguida, atribua fileInfo à opção de imagem setFileInfo.
  • Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
  • Por fim, obtenha os resultados chamando o método ParseApi.images() e passando o parâmetro ImagesRequest.

O exemplo de código a seguir mostra como extrair todas as imagens de um arquivo PDF online em Java usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Como extrair imagens de um arquivo PDF em Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extraia imagens específicas de arquivos PDF em Java usando o número da página

Nesta seção, forneceremos etapas e um trecho de código para extrair imagens específicas de um arquivo PDF programaticamente em Java:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o documento PDF de entrada.
  • Em seguida, crie uma instância da classe ImagesOptions().
  • Em seguida, atribua fileInfo à opção de imagem setFileInfo.
  • Em seguida, forneça os valores setStartPageNumber e setCountPagesToExtract.
  • Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
  • Por fim, obtenha os resultados chamando o método ParseApi.images() e passando o parâmetro ImagesRequest.

O exemplo de código a seguir mostra como extrair imagens específicas de um arquivo PDF por intervalo de páginas em Java usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extraia imagens de um arquivo PDF online por intervalo de páginas em Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrator de Imagens Online Gratuito

Qual é a melhor maneira de extrair imagens de PDF online gratuitamente? Por favor, tente um analisador de arquivo PDF online para extrair imagens de arquivos PDF. Este software PDF Parser é desenvolvido usando a biblioteca de analisador Java mencionada acima.

Conclusão

Em conclusão, GroupDocs.Parser Cloud SDK para Java fornece uma solução confiável e eficiente para extrair imagens de arquivos PDF com facilidade. O seguinte é o que você aprendeu com este artigo:

  • como extrair todas as imagens de arquivos PDF programaticamente em Java usando a API REST;
  • como extrair imagens específicas de documentos PDF em Java usando REST API;
  • e ferramenta de extração de imagem online para extrair imagens de documentos PDF.

Além disso, você pode aprender mais sobre GroupDocs.Parser Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github.

Por fim, continuamos escrevendo novos artigos de blog em diferentes formatos de arquivo e analisando-os usando a API REST. Portanto, entre em contato para obter as atualizações mais recentes.

Faça uma pergunta

Caso você tenha alguma dúvida sobre como analisar documentos, sinta-se à vontade para nos contatar através do nosso fórum.

perguntas frequentes

Como faço para analisar arquivos PDF usando Java?

Para extrair imagens, texto ou metadados, primeiro você precisa carregar e analisar o documento PDF usando GroupDocs.Parser Cloud SDK. Esse processo envolve especificar o caminho do arquivo e chamar o método Parse para analisar arquivos PDF.

O GroupDocs.Parser Cloud SDK para Java oferece suporte a outros formatos de arquivo além do PDF?

Sim, além de arquivos PDF, GroupDocs.Parser Cloud SDK for Java suporta a extração de imagens de vários formatos de documento, incluindo Word, Excel, PowerPoint, HTML e muitos mais.

Posso extrair todas as imagens de um arquivo PDF usando GroupDocs.Parser Cloud SDK para Java?

Sim, você pode extrair todas as imagens de um arquivo PDF usando o GroupDocs.Parser Cloud SDK for Java.

Veja também

Aqui estão alguns artigos relacionados que podem ser úteis: