Parser de Arquivos PDF – Extraia Imagens de Arquivos PDF Online em Java

PDF(Formato de Documento Portátil) é um formato de arquivo amplamente utilizado para compartilhar e preservar documentos online. Ele frequentemente contém vários tipos de conteúdo, incluindo texto, imagens, tabelas e mais. Extrair conteúdo específico de arquivos PDF, como imagens, pode ser uma tarefa desafiadora sem ferramentas confiáveis ou uma biblioteca. Uma dessas ferramentas é o GroupDocs.Parser Cloud SDK para Java, que oferece uma maneira contínua e eficiente de extrair imagens de arquivos PDF. Neste artigo, iremos demonstrar como extrair imagens de arquivos PDF em Java usando REST API.

Os seguintes tópicos serão abordados neste artigo:

Java REST API para Separar Imagens de PDF e Instalação do SDK

GroupDocs.Parser Cloud SDK for Java é uma poderosa e versátil biblioteca Java que oferece uma maneira simples e eficiente de analisar e extrair dados de vários formatos de documentos, incluindo arquivos PDF. Ela oferece uma ampla gama de recursos para análise de documentos, permitindo que os desenvolvedores extraiam imagens, texto, metadados e outros conteúdos. GroupDocs.Parser também fornece C#.NET, Java, PHP, Ruby e SDKs Python como seus membros da família do analisador de documentos para as APIs em nuvem.

Para começar, você precisa incluir o SDK do GroupDocs.Parser Cloud no seu projeto Java. Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven, adicionando o seguinte repositório e dependência no arquivo pom.xml do seu projeto:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Em seguida, você precisa sign up para uma conta de teste gratuita ou purchase a subscription plan no site do GroupDocs e get your API key. Uma vez que você tenha o Client Id e o Client Secret, adicione o código abaixo a uma aplicação baseada em Java:

# Obtenha seu clientid e clientsecret em https://dashboard.groupdocs.cloud após o registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Como Extrair Todas as Imagens de Arquivos PDF em Java usando REST API

Agora, vamos escrever os passos e um exemplo de código para extrair imagens de arquivos PDF usando o GroupDocs.Parser Cloud SDK para Java:

  • Primeiro, importe as classes necessárias no seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o documento PDF de entrada.
  • Então, crie uma instância da classe ImagesOptions().
  • Em seguida, atribua fileInfo à opção de imagem setFileInfo.
  • Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
  • Por fim, obtenha os resultados chamando o ParseApi.images() método e passando o parâmetro ImagesRequest.

O seguinte exemplo de código mostra como extrair todas as imagens de um arquivo PDF online em Java usando a API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Como extrair imagens de um arquivo PDF em Java.
public class App {

	public static void main(String[] args) {
		
		// Criar uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrair Imagens Específicas de Arquivos PDF em Java Usando Número da Página

Nesta seção, forneceremos etapas e um trecho de código para extrair imagens específicas de um arquivo PDF programaticamente em Java:

  • Primeiro, importe as classes necessárias no seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe ParseApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Em seguida, defina o caminho para o documento PDF de entrada.
  • Então, crie uma instância da classe ImagesOptions().
  • Em seguida, atribua fileInfo à opção de imagem setFileInfo.
  • Então, forneça valores para setStartPageNumber e setCountPagesToExtract.
  • Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
  • Por último, obtenha resultados chamando o ParseApi.images() método e passando o parâmetro ImagesRequest.

O seguinte exemplo de código mostra como extrair imagens específicas de um arquivo PDF por intervalo de páginas em Java usando REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extrair imagens de um arquivo PDF online por faixa de páginas em Java.
public class App {

	public static void main(String[] args) {
		
		// Criar uma instância da API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extractor de Imagens Online Gratuito

Qual é a melhor maneira de extrair imagens de PDF online e gratuitamente? Tente usar um online PDF File parser para extrair imagens de arquivos PDF. Este software PDF Parser foi desenvolvido usando a biblioteca de parser Java mencionada acima.

Conclusão

Em conclusão, o GroupDocs.Parser Cloud SDK para Java fornece uma solução confiável e eficiente para extrair imagens de arquivos PDF com facilidade. O que você aprendeu neste artigo é o seguinte:

  • How to extract all images from PDF files programmatically in Java using REST API;
  • Como extrair imagens específicas de documentos PDF em Java usando API REST;
  • Ferramenta online de extração de imagens para extrair imagens de documentos PDF.

Além disso, você pode aprender mais sobre o GroupDocs.Parser Cloud API usando a documentação. Também fornecemos uma seção de Referência de API que permite visualizar e interagir com nossas APIs diretamente através do navegador. O código-fonte completo do SDK Java está disponível gratuitamente no Github.

Finalmente, continuamos escrevendo novos artigos no blog sobre diferentes formatos de arquivo e como analisá-los usando REST API. Portanto, entre em contato para as últimas atualizações.

Ask a question

Caso tenha alguma dúvida sobre como analisar documentos, sinta-se à vontade para entrar em contato conosco através do nosso forum.

FAQs

How do I parse PDF files using Java?

Para extrair imagens, texto ou metadados, você primeiro precisa carregar e analisar o documento PDF usando GroupDocs.Parser Cloud SDK. Esse processo envolve especificar o caminho do arquivo e chamar o método Parse para analisar arquivos PDF.

Does GroupDocs.Parser Cloud SDK for Java support other file formats besides PDF?

Sim, além de arquivos PDF, GroupDocs.Parser Cloud SDK for Java suporta a extração de imagens de vários formatos de documento, incluindo Word, Excel, PowerPoint, HTML e muitos mais.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

Sim, você pode extrair todas as imagens de um arquivo PDF usando o GroupDocs.Parser Cloud SDK for Java.

Veja Também

Aqui estão alguns artigos relacionados que você pode achar úteis: