Cómo extraer páginas de documentos de Word en línea en Java

Extraer páginas de documentos: extraiga páginas de un archivo de Word en Java.

¿Tiene dificultades para extraer páginas específicas de un documento de Word en Java? Cuando se trabaja con documentos de Word grandes, puede ser una tarea desafiante extraer páginas específicas de un documento de Word grande. Afortunadamente, GroupDocs.Merger Cloud SDK for Java lo ayuda a facilitar este proceso. En este artículo, exploraremos cómo extraer páginas de un archivo de Word en Java utilizando GroupDocs.Merger Cloud SDK para Java.

En este artículo se tratarán los siguientes temas:

API de REST de Java para extraer páginas de documentos de Word: instalación de SDK{#API-REST-de-Java para extraer páginas de documentos de Word-Instalación de SDK}

GroupDocs.Merger Cloud SDK for Java es una potente API que permite a los desarrolladores fusionar, dividir, reordenar, extraer y manipular documentos y archivos en la nube. Proporciona una manera fácil, confiable y rápida de administrar páginas de documentos y su contenido. Es compatible con los formatos de archivo más populares, como PDF, Word, Excel, HTML, PowerPoint y muchos más. Este poderoso SDK es fácil de usar y puede integrarse en una aplicación basada en Java para automatizar el proceso de manipulación de archivos.

Puede descargar el archivo JAR de la API o instalarlo usando Maven agregando el siguiente repositorio y dependencia en el archivo pom.xml de su proyecto:

Repositorio Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependencia Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Ahora, debe registrarse para obtener una cuenta de prueba gratuita o comprar un plan de suscripción en el sitio web de GroupDocs para obtener su clave API. Una vez que tenga la identificación del cliente y el secreto del cliente, agregue el siguiente fragmento de código a una aplicación basada en Java:

# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Extraer páginas de documentos de Word en Java usando números de página exactos

Ahora que hemos configurado nuestro entorno, veamos cómo usar GroupDocs.Merger Cloud SDK para Java para extraer páginas de un documento de Word. Aquí están los pasos:

Sube los archivos

En primer lugar, cargue el documento de Word en la nube usando el ejemplo de código que se muestra a continuación:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Sube el archivo a Cloud Storage usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Como resultado, el archivo de Word cargado estará disponible en la sección de archivos de su tablero en la nube.

Extraer páginas de documentos de Word en Java

En esta sección, cubriremos los pasos y un fragmento de código de ejemplo sobre cómo extraer páginas de un documento de Word usando GroupDocs.Merger Cloud SDK para Java:

  • En primer lugar, importe las clases requeridas en su archivo Java.
  • En segundo lugar, cree una instancia de la clase PagesApi.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Después de eso, configure la ruta del archivo de entrada de origen.
  • Ahora, crea una instancia de la clase ExtractOptions().
  • Luego, defina las opciones de extracción setFileInfo, setOutputPath y la colección setPages en formato de matriz.
  • Ahora, cree una instancia de la clase ExtractRequest() y pase el parámetro ExtractOptions.
  • Finalmente, extraiga páginas DOCX llamando al método extract() de PagesApi y pasando el parámetro ExtractRequest.

El siguiente fragmento de código muestra cómo extraer páginas de documentos de Word en un archivo nuevo en Java mediante la API REST:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extraiga páginas de un documento de Word en Java usando números de página exactos.
public class App {

	public static void main(String[] args) {

		// Cree una instancia de la API de páginas.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparar los ajustes
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtener la ruta del archivo de salida
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Descargar el archivo

El ejemplo de código anterior guardará páginas extraídas de documentos de Word en la nube. Puede descargarlo utilizando el siguiente ejemplo de código:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Descargar archivo desde el almacenamiento en la nube usando Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Extraer páginas de archivos de Word en Java usando el rango de números de página

En esta sección, proporcionaremos pasos y un fragmento de código de ejemplo sobre cómo extraer páginas específicas de un documento de Word por rango de número de página exacto:

  • En primer lugar, importe las clases requeridas en su archivo Java.
  • En segundo lugar, cree una instancia de la clase PagesApi.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Después de eso, configure la ruta del archivo de entrada de origen.
  • Ahora, crea una instancia de la clase ExtractOptions().
  • Luego, defina las opciones de extracción setFileInfo, setOutputPath, setStartPageNumber y setEndPageNumber.
  • A continuación, establezca las opciones de página setRangeMode en EVENPAGES.
  • Ahora, cree una instancia de la clase ExtractRequest() y pase el parámetro ExtractOptions.
  • Finalmente, extraiga páginas llamando al método extract() de PagesApi y pasando el parámetro ExtractRequest.

El siguiente fragmento de código muestra cómo extraer páginas de archivos de Word aplicando el rango de páginas y el modo usando Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extraiga páginas de un archivo de Word en Java utilizando el rango de números de página.
public class App {

	public static void main(String[] args) {
		
		// Cree una instancia de la API de páginas.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Preparar los ajustes
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtener la ruta del archivo de salida
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extractor de documentos de Word en línea gratuito

¿Cómo extraer páginas de documentos de Word gratis? Pruebe el extractor de páginas de Word en línea para extraer páginas específicas de documentos de Word de forma gratuita. Esta herramienta de extracción de páginas de Word en línea se desarrolla utilizando las API de Groupdocs.Merger Cloud mencionadas anteriormente.

Conclusión

En conclusión, GroupDocs.Merger Cloud SDK para Java es una excelente opción que puede ayudar a los desarrolladores a extraer páginas de documentos de Word en línea. Lo siguiente es lo que has aprendido en este artículo:

  • cómo extraer páginas de documentos de Word por número de página usando Java;
  • cargue y descargue mediante programación el documento de Word en la nube;
  • extraer páginas Word DOCX en Java usando el rango exacto de números de página;
  • y extraiga páginas de Word de forma gratuita utilizando una herramienta de extracción de páginas de Word en línea.

Además, también proporcionamos una sección de referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. El código fuente completo de Java SDK está disponible gratuitamente en Github. Consulte GroupDocs.Merger Cloud SDK para Java Ejemplos aquí.

Además, le sugerimos que siga nuestra Guía de introducción para conocer los pasos detallados y el uso de la API.

Finalmente, seguimos escribiendo nuevas publicaciones de blog sobre diferentes operaciones de documentos utilizando la API REST. Por lo tanto, póngase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Si tiene alguna pregunta sobre cómo extraer páginas de documentos, no dude en consultarnos en el Foro de soporte gratuito.

preguntas frecuentes

¿Cómo extraigo páginas de un documento de Word en línea en Java?

Puede extraer páginas de un archivo de Word usando GroupDocs.Merger Cloud SDK for Java y agilizar su flujo de trabajo.

¿Puedo extraer páginas específicas utilizando la API REST?

Sí, puede especificar el número de página en un formato de matriz para extraer páginas específicas usando GroupDocs.Merger Cloud SDK for Java.

¿Qué formatos de archivo son compatibles con GroupDocs.Merger Cloud SDK for Java?

GroupDocs.Merger Cloud SDK para Java admite una amplia gama de formatos de archivo, incluidos Word, Excel, JPG, PowerPoint, PDF, HTML y muchos más.

¿Puedo extraer varias páginas de un archivo de Word con GroupDocs.Merger Cloud SDK para Java?

Sí, puede extraer varias páginas de un documento de Word usando GroupDocs.Merger Cloud SDK for Java especificando el rango de páginas que desea extraer.

Ver también

Aquí hay algunos artículos relacionados que pueden resultarle útiles: