Cómo extraer páginas PDF en Java

Extraer páginas de PDF en Java - Separar páginas PDF en línea.

Si está trabajando con archivos PDF, es posible que se encuentre en una situación en la que necesite extraer páginas de un archivo PDF. Extraer páginas de un archivo PDF puede ser una tarea que requiere mucho tiempo, especialmente si tiene que hacerlo manualmente o manejar documentos grandes. Afortunadamente, con la ayuda de GroupDocs.Merger Cloud SDK para Java, puede extraer fácilmente páginas de un archivo PDF mediante programación. En este artículo, exploraremos cómo extraer páginas de PDF en Java.

En este artículo se tratarán los siguientes temas:

Instalación de SDK y API REST de Java PDF Pages Extractor

GroupDocs.Merger Cloud SDK para Java es una API basada en la nube que permite a los desarrolladores fusionar, extraer, dividir, reordenar y eliminar páginas de archivos y otros tipos de documentos, incluidos Word, Excel , PowerPoint, HTML, PDF y muchos más. Este poderoso SDK es fácil de usar y puede integrarse en una aplicación basada en Java para automatizar las tareas de manipulación de archivos.

Puede descargar el archivo JAR de la API o instalarlo usando Maven agregando el siguiente repositorio y dependencia en el archivo pom.xml de su proyecto:

Repositorio Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependencia Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Ahora, debe registrarse para obtener una cuenta de prueba gratuita o comprar un plan de suscripción en el sitio web de GroupDocs para obtener su clave API. Una vez que tenga la identificación del cliente y el secreto del cliente, agregue el siguiente fragmento de código a una aplicación basada en Java:

# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Cómo extraer páginas PDF por números de página exactos en Java

Para extraer páginas de un archivo PDF con GroupDocs.Merger Cloud SDK para Java, deberá seguir estos pasos:

Sube los archivos

En primer lugar, cargue el archivo PDF en la nube usando el ejemplo de código que se muestra a continuación:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Sube el archivo a Cloud Storage usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Como resultado, el archivo PDF cargado estará disponible en la sección de archivos de su tablero en la nube.

Extraer páginas de archivos PDF en Java

Aquí hay una guía paso a paso y un fragmento de código de ejemplo sobre cómo extraer páginas de un archivo PDF usando GroupDocs.Merger Cloud SDK para Java:

  • En primer lugar, importe las clases requeridas en su archivo Java.
  • En segundo lugar, cree una instancia de la clase PagesApi.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Después de eso, configure la ruta del archivo de entrada de origen.
  • Ahora, crea una instancia de la clase ExtractOptions().
  • Luego, defina las opciones de extracción setFileInfo, setOutputPath y la colección setPages en formato de matriz.
  • Ahora, cree una instancia de la clase ExtractRequest() y pase el parámetro ExtractOptions.
  • Finalmente, extraiga páginas llamando al método extract() de PagesApi y pasando el parámetro ExtractRequest.

El siguiente fragmento de código muestra cómo separar archivos PDF en páginas individuales en Java utilizando la API REST:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Cómo extraer páginas PDF por números de página exactos en Java.
public class App {

	public static void main(String[] args) {

		// Cree una instancia de la API de páginas.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparar los ajustes
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtener la ruta del archivo de salida
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Descargar el archivo

El ejemplo de código anterior guardará páginas específicas de PDF en la nube. Puede descargarlo utilizando el siguiente ejemplo de código:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Descargar archivo desde el almacenamiento en la nube usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Cómo extraer páginas de PDF por rangos de páginas usando Java

En esta sección, cubriremos una guía paso a paso y un fragmento de código de ejemplo para guardar páginas seleccionadas de PDF usando Java aplicando el rango de páginas:

  • En primer lugar, importe las clases requeridas en su archivo Java.
  • En segundo lugar, cree una instancia de la clase PagesApi.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Después de eso, configure la ruta del archivo de entrada de origen.
  • Ahora, crea una instancia de la clase ExtractOptions().
  • Luego, defina las opciones de extracción setFileInfo, setOutputPath, setStartPageNumber y setEndPageNumber.
  • A continuación, establezca las opciones de página setRangeMode en EVENPAGES.
  • Ahora, cree una instancia de la clase ExtractRequest() y pase el parámetro ExtractOptions.
  • Finalmente, extraiga páginas llamando al método extract() de PagesApi y pasando el parámetro ExtractRequest.

El siguiente fragmento de código muestra cómo extraer páginas PDF aplicando el rango y el modo de páginas en Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Cómo extraer páginas de PDF por rangos de páginas usando Java.
public class App {

	public static void main(String[] args) {
		
		// Cree una instancia de la API de páginas.		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparar los ajustes
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtener la ruta del archivo de salida
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extractor de páginas PDF en línea gratuito

¿Cómo extraer páginas PDF gratis? Pruebe el extractor de páginas PDF gratuito para extraer páginas específicas de PDF de forma gratuita. Este extractor de páginas PDF en línea se desarrolla utilizando las API de Groupdocs.Merger Cloud mencionadas anteriormente.

Conclusión

GroupDocs.Merger Cloud SDK para Java proporciona una manera fácil de extraer páginas PDF a un nuevo PDF en Java. Lo siguiente es lo que has aprendido en este artículo:

  • cómo separar archivos PDF en varias páginas por número usando Java;
  • cargue y descargue mediante programación el archivo PDF usando Java en la nube;
  • separar PDF en páginas individuales en Java usando rangos de páginas;
  • y extraiga páginas de PDF en línea de forma gratuita utilizando un extractor de páginas PDF gratuito en línea.

Además, también proporcionamos una sección de referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. El código fuente completo de Java SDK está disponible gratuitamente en Github. Consulte GroupDocs.Merger Cloud SDK para Java Ejemplos aquí.

Además, le sugerimos que siga nuestra Guía de introducción para conocer los pasos detallados y el uso de la API.

Finalmente, seguimos escribiendo nuevas publicaciones de blog sobre diferentes operaciones de documentos utilizando la API REST. Por lo tanto, póngase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Si tiene alguna pregunta sobre la API de extracción de páginas PDF, no dude en consultarnos en el Foro de soporte gratuito.

preguntas frecuentes

¿Cómo extraigo páginas de un archivo PDF en Java?

Puede extraer páginas de un archivo PDF usando GroupDocs.Merger Cloud SDK for Java.

¿Es posible exportar una sola página de PDF en Java?

Sí, puede extraer páginas PDF en archivos individuales mediante programación en Java usando GroupDocs.Merger Cloud SDK for Java.

¿De qué formatos de archivo puedo extraer páginas usando GroupDocs.Merger Cloud SDK para Java?

Además de archivos PDF, GroupDocs.Merger Cloud SDK para Java puede extraer páginas de Microsoft Word, Excel, PowerPoint, HTML y otros formatos de archivo.

Ver también

Aquí hay algunos artículos relacionados que pueden resultarle útiles: