PDF(Portable Document Format) é um formato de arquivo amplamente usado para compartilhar e preservar documentos online. Geralmente contém vários tipos de conteúdo, incluindo texto, imagens, tabelas e muito mais. Extrair conteúdo específico de arquivos PDF, como imagens, pode ser uma tarefa desafiadora sem ferramentas confiáveis ou uma biblioteca. Uma dessas ferramentas é o GroupDocs.Parser Cloud SDK para Java, que fornece uma maneira simples e eficiente de extrair imagens de arquivos PDF. Neste artigo, demonstraremos como extrair imagens de arquivos PDF em Java usando a API REST.
Os seguintes tópicos serão abordados neste artigo:
- Java REST API para separar imagens de instalação de PDF e SDK
- Como extrair todas as imagens de arquivos PDF em Java usando a API REST
- Extrair imagens específicas de arquivos PDF em Java usando o número da página
Java REST API para separar imagens de instalação de PDF e SDK
GroupDocs.Parser Cloud SDK for Java é uma biblioteca Java poderosa e versátil que fornece uma maneira simples e eficiente de analisar e extrair dados de vários formatos de documento, incluindo arquivos PDF. Ele oferece uma ampla gama de recursos para análise de documentos, permitindo que os desenvolvedores extraiam imagens, texto, metadados e outros conteúdos. GroupDocs.Parser também fornece SDKs C#.NET, Java, PHP, Ruby e Python como seus membros da família de analisadores de documentos para APIs de nuvem.
Para começar, você precisa incluir o GroupDocs.Parser Cloud SDK em seu projeto Java. Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:
Repositório Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dependência do Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Em seguida, você precisa inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs e obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Java:
# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Como extrair todas as imagens de arquivos PDF em Java usando a API REST
Agora, vamos escrever as etapas e um trecho de código de exemplo para extrair imagens de arquivos PDF usando GroupDocs.Parser Cloud SDK for Java:
- Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
- Em segundo lugar, crie uma instância da classe ParseApi.
- Em terceiro lugar, crie uma instância da classe FileInfo.
- Em seguida, defina o caminho para o documento PDF de entrada.
- Em seguida, crie uma instância da classe ImagesOptions().
- Em seguida, atribua fileInfo à opção de imagem setFileInfo.
- Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
- Por fim, obtenha os resultados chamando o método ParseApi.images() e passando o parâmetro ImagesRequest.
O exemplo de código a seguir mostra como extrair todas as imagens de um arquivo PDF online em Java usando a API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Como extrair imagens de um arquivo PDF em Java.
public class App {
public static void main(String[] args) {
// Crie uma instância da API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Prepare as configurações
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Obter caminho do arquivo de saída
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extraia imagens específicas de arquivos PDF em Java usando o número da página
Nesta seção, forneceremos etapas e um trecho de código para extrair imagens específicas de um arquivo PDF programaticamente em Java:
- Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
- Em segundo lugar, crie uma instância da classe ParseApi.
- Em terceiro lugar, crie uma instância da classe FileInfo.
- Em seguida, defina o caminho para o documento PDF de entrada.
- Em seguida, crie uma instância da classe ImagesOptions().
- Em seguida, atribua fileInfo à opção de imagem setFileInfo.
- Em seguida, forneça os valores setStartPageNumber e setCountPagesToExtract.
- Agora, crie uma instância da classe ImagesRequest() e passe o parâmetro ImagesOptions.
- Por fim, obtenha os resultados chamando o método ParseApi.images() e passando o parâmetro ImagesRequest.
O exemplo de código a seguir mostra como extrair imagens específicas de um arquivo PDF por intervalo de páginas em Java usando a API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Extraia imagens de um arquivo PDF online por intervalo de páginas em Java.
public class App {
public static void main(String[] args) {
// Crie uma instância da API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Prepare as configurações
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Obter caminho do arquivo de saída
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extrator de Imagens Online Gratuito
Qual é a melhor maneira de extrair imagens de PDF online gratuitamente? Por favor, tente um analisador de arquivo PDF online para extrair imagens de arquivos PDF. Este software PDF Parser é desenvolvido usando a biblioteca de analisador Java mencionada acima.
Conclusão
Em conclusão, GroupDocs.Parser Cloud SDK para Java fornece uma solução confiável e eficiente para extrair imagens de arquivos PDF com facilidade. O seguinte é o que você aprendeu com este artigo:
- como extrair todas as imagens de arquivos PDF programaticamente em Java usando a API REST;
- como extrair imagens específicas de documentos PDF em Java usando REST API;
- e ferramenta de extração de imagem online para extrair imagens de documentos PDF.
Além disso, você pode aprender mais sobre GroupDocs.Parser Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github.
Por fim, continuamos escrevendo novos artigos de blog em diferentes formatos de arquivo e analisando-os usando a API REST. Portanto, entre em contato para obter as atualizações mais recentes.
Faça uma pergunta
Caso você tenha alguma dúvida sobre como analisar documentos, sinta-se à vontade para nos contatar através do nosso fórum.
perguntas frequentes
Como faço para analisar arquivos PDF usando Java?
Para extrair imagens, texto ou metadados, primeiro você precisa carregar e analisar o documento PDF usando GroupDocs.Parser Cloud SDK. Esse processo envolve especificar o caminho do arquivo e chamar o método Parse para analisar arquivos PDF.
O GroupDocs.Parser Cloud SDK para Java oferece suporte a outros formatos de arquivo além do PDF?
Sim, além de arquivos PDF, GroupDocs.Parser Cloud SDK for Java suporta a extração de imagens de vários formatos de documento, incluindo Word, Excel, PowerPoint, HTML e muitos mais.
Posso extrair todas as imagens de um arquivo PDF usando GroupDocs.Parser Cloud SDK para Java?
Sim, você pode extrair todas as imagens de um arquivo PDF usando o GroupDocs.Parser Cloud SDK for Java.
Veja também
Aqui estão alguns artigos relacionados que podem ser úteis:
- Extrair imagens de documentos do Word usando Java
- Análise de Documento – Extrair Texto de Arquivo PDF em Java
- Extrair dados de PDF usando API REST em Node.js
- Analisar documentos do Word usando a API REST em Python
- Extrair dados específicos de PDF usando Python
- Extrair imagens de documentos PDF usando Python