Como extrair páginas PDF em Java

Extraia páginas de PDF em Java - Separe páginas de PDF online.

Se estiver trabalhando com arquivos PDF, você pode se deparar com uma situação em que precisa extrair páginas de um arquivo PDF. Extrair páginas de um arquivo PDF pode ser uma tarefa demorada, especialmente se você precisar fazer isso manualmente ou lidar com documentos grandes. Felizmente, com a ajuda do GroupDocs.Merger Cloud SDK para Java, você pode facilmente extrair páginas de um arquivo PDF programaticamente. Neste artigo, vamos explorar como extrair páginas de PDF em Java.

Os seguintes tópicos serão abordados neste artigo:

Java PDF Pages Extractor REST API e instalação do SDK

GroupDocs.Merger Cloud SDK for Java é uma API baseada em nuvem que permite aos desenvolvedores mesclar, extrair, dividir, reordenar e remover páginas de arquivos e outros tipos de documentos, incluindo Word, Excel , PowerPoint, HTML, PDF e muito mais. Este poderoso SDK é fácil de usar e pode ser integrado a um aplicativo baseado em Java para automatizar tarefas de manipulação de arquivos.

Você pode baixar o arquivo JAR da API ou instalá-lo usando o Maven adicionando o seguinte repositório e dependência ao arquivo pom.xml do seu projeto:

Repositório Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependência do Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Agora, você precisa inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs para obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Java:

# Obtenha seu client_id e client_secret em https://dashboard.groupdocs.cloud após o registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Como extrair páginas PDF por números de página exatos em Java

Para extrair páginas de um arquivo PDF usando GroupDocs.Merger Cloud SDK para Java, você precisará seguir estas etapas:

Envie os arquivos

Em primeiro lugar, carregue o arquivo PDF para a nuvem usando o exemplo de código abaixo:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Carregar arquivo para o Cloud Storage usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Como resultado, o arquivo PDF carregado estará disponível na seção de arquivos do seu painel na nuvem.

Extraia páginas de arquivos PDF em Java

Aqui está um guia passo a passo e um trecho de código de exemplo sobre como extrair páginas de um arquivo PDF usando GroupDocs.Merger Cloud SDK for Java:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe PagesApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Depois disso, defina o caminho do arquivo de entrada de origem.
  • Agora, crie uma instância da classe ExtractOptions().
  • Em seguida, defina as opções de extração setFileInfo, setOutputPath e coleção setPages em formato de matriz.
  • Agora, crie uma instância da classe ExtractRequest() e passe o parâmetro ExtractOptions.
  • Por fim, extraia as páginas chamando o método extract() da PagesApi e passando o parâmetro ExtractRequest.

O trecho de código a seguir mostra como separar arquivos PDF em páginas individuais em Java usando a API REST:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Como extrair páginas PDF por números de página exatos em Java.
public class App {

	public static void main(String[] args) {

		// Crie uma instância da API de páginas.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Baixe o arquivo

O exemplo de código acima salvará páginas específicas do PDF na nuvem. Você pode baixá-lo usando o seguinte exemplo de código:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Baixe o arquivo do armazenamento em nuvem usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Como extrair páginas de PDF por intervalos de páginas usando Java

Nesta seção, abordaremos um guia passo a passo e um trecho de código de exemplo para salvar páginas selecionadas do PDF usando Java aplicando o intervalo de páginas:

  • Em primeiro lugar, importe as classes necessárias para o seu arquivo Java.
  • Em segundo lugar, crie uma instância da classe PagesApi.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Depois disso, defina o caminho do arquivo de entrada de origem.
  • Agora, crie uma instância da classe ExtractOptions().
  • Em seguida, defina as opções de extração setFileInfo, setOutputPath, setStartPageNumber e setEndPageNumber.
  • Em seguida, defina as opções de página setRangeMode como EVENPAGES.
  • Agora, crie uma instância da classe ExtractRequest() e passe o parâmetro ExtractOptions.
  • Por fim, extraia as páginas chamando o método extract() da PagesApi e passando o parâmetro ExtractRequest.

O trecho de código a seguir mostra como extrair páginas de PDF aplicando intervalo e modo de páginas em Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Como extrair páginas de PDF por intervalos de páginas usando Java.
public class App {

	public static void main(String[] args) {
		
		// Crie uma instância da API de páginas.		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Prepare as configurações
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obter caminho do arquivo de saída
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrator de página de PDF on-line gratuito

Como extrair páginas PDF gratuitamente? Por favor, experimente o extrator de páginas PDF gratuito para extrair páginas específicas de PDF gratuitamente. Este extrator de página PDF online é desenvolvido usando as APIs Groupdocs.Merger Cloud mencionadas acima.

Conclusão

GroupDocs.Merger Cloud SDK para Java fornece uma maneira fácil de extrair páginas PDF para um novo PDF em Java. O seguinte é o que você aprendeu neste artigo:

  • como separar arquivos PDF em várias páginas por número usando Java;
  • carregar e baixar programaticamente o arquivo PDF usando Java na nuvem;
  • PDF separado em páginas individuais em Java usando intervalos de páginas;
  • e extraia páginas de PDF online gratuitamente usando um extrator de páginas PDF gratuito online.

Além disso, também fornecemos uma seção de referência de API que permite que você visualize e se comunique com nossas APIs diretamente pelo navegador. O código-fonte completo do Java SDK está disponível gratuitamente no Github. Verifique o GroupDocs.Merger Cloud SDK para Java Exemplos aqui.

Além disso, sugerimos que você siga nosso guia de primeiros passos para obter etapas detalhadas e uso da API.

Por fim, continuamos escrevendo novas postagens de blog sobre diferentes operações de documentos usando a API REST. Então, por favor, entre em contato para as atualizações regulares.

Faça uma pergunta

Se você tiver alguma dúvida sobre a API do extrator de páginas PDF, sinta-se à vontade para nos perguntar no Fórum de suporte gratuito.

perguntas frequentes

Como faço para extrair páginas de um arquivo PDF em Java?

Você pode extrair páginas de um arquivo PDF usando GroupDocs.Merger Cloud SDK for Java.

É possível exportar uma única página de PDF em Java?

Sim, você pode extrair páginas PDF em arquivos únicos programaticamente em Java usando GroupDocs.Merger Cloud SDK for Java.

De quais formatos de arquivo posso extrair páginas usando GroupDocs.Merger Cloud SDK para Java?

Além dos arquivos PDF, GroupDocs.Merger Cloud SDK para Java pode extrair páginas do Microsoft Word, Excel, PowerPoint, HTML e outros formatos de arquivo.

Veja também

Aqui estão alguns artigos relacionados que podem ser úteis: