Comment extraire des pages de document Word en ligne en Java

Extraire des pages de document - Extraire des pages d’un fichier Word en Java.

Avez-vous du mal à extraire des pages spécifiques d’un document Word en Java ? Lorsque vous travaillez avec des documents Word volumineux, il peut être difficile d’extraire des pages spécifiques d’un document Word volumineux. Heureusement, le GroupDocs.Merger Cloud SDK pour Java vous aide à faciliter ce processus. Dans cet article, nous allons explorer comment extraire des pages d’un fichier Word en Java à l’aide de GroupDocs.Merger Cloud SDK pour Java.

Les sujets suivants seront traités dans cet article :

API REST Java pour extraire les pages de documents Word - Installation du SDK

GroupDocs.Merger Cloud SDK for Java est une API puissante qui permet aux développeurs de fusionner, diviser, réorganiser, extraire et manipuler des documents et des fichiers dans le cloud. Il fournit un moyen simple, fiable et rapide de gérer les pages de document et leur contenu. Il est compatible avec la plupart des formats de fichiers tels que PDF, Word, Excel, HTML, PowerPoint et bien d’autres. Ce puissant SDK est facile à utiliser et peut être intégré dans une application basée sur Java pour automatiser le processus de manipulation de fichiers.

Vous pouvez soit télécharger le fichier JAR de l’API, soit l’installer à l’aide de Maven en ajoutant le référentiel et la dépendance suivants dans le fichier pom.xml de votre projet :

Référentiel Maven :

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dépendance Maven :

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Maintenant, vous devez vous inscrire pour un compte d’essai gratuit ou acheter un plan d’abonnement sur le site Web de GroupDocs pour obtenir votre clé API. Une fois que vous avez l’ID client et le secret client, ajoutez l’extrait de code ci-dessous à une application basée sur Java :

# Obtenez votre client_id et client_secret depuis https://dashboard.groupdocs.cloud après l'inscription.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Extraire des pages de documents Word en Java à l’aide de numéros de page exacts

Maintenant que nous avons configuré notre environnement, voyons comment utiliser le SDK GroupDocs.Merger Cloud pour Java pour extraire des pages d’un document Word. Voici les étapes :

Télécharger les fichiers

Tout d’abord, téléchargez le document Word dans le cloud en utilisant l’exemple de code ci-dessous :

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Télécharger le fichier sur le Cloud Storage à l'aide de Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Par conséquent, le fichier Word téléchargé sera disponible dans la section des fichiers de votre tableau de bord sur le cloud.

Extraire des pages de documents Word en Java

Dans cette section, nous couvrirons les étapes et un exemple d’extrait de code sur la façon d’extraire des pages d’un document Word à l’aide de GroupDocs.Merger Cloud SDK pour Java :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe PagesApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Après cela, définissez le chemin du fichier d’entrée source.
  • Maintenant, créez une instance de la classe ExtractOptions().
  • Ensuite, définissez les options d’extraction setFileInfo, setOutputPath et la collection setPages au format tableau.
  • Maintenant, créez une instance de la classe ExtractRequest() et transmettez le paramètre ExtractOptions.
  • Enfin, extrayez les pages DOCX en appelant la méthode extract() de PagesApi et en passant le paramètre ExtractRequest.

L’extrait de code suivant montre comment extraire des pages de document Word dans un nouveau fichier en Java à l’aide de l’API REST :

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extraire des pages d'un document Word en Java en utilisant des numéros de page exacts.
public class App {

	public static void main(String[] args) {

		// Créez une instance de l'API Pages.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Préparer les paramètres
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Télécharger le fichier

L’exemple de code ci-dessus enregistrera les pages extraites des documents Word sur le cloud. Vous pouvez le télécharger à l’aide de l’exemple de code suivant :

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Télécharger le fichier à partir du Cloud Storage à l'aide de Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Extraire des pages de fichiers Word en Java à l’aide de la plage de numéros de page

Dans cette section, nous fournirons des étapes et un exemple d’extrait de code sur la façon d’extraire des pages spécifiques d’un document Word par plage de numéros de page exacte :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe PagesApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Après cela, définissez le chemin du fichier d’entrée source.
  • Maintenant, créez une instance de la classe ExtractOptions().
  • Ensuite, définissez les options d’extraction setFileInfo, setOutputPath, setStartPageNumber et setEndPageNumber.
  • Ensuite, définissez les options de page setRangeMode sur EVENPAGES.
  • Maintenant, créez une instance de la classe ExtractRequest() et transmettez le paramètre ExtractOptions.
  • Enfin, extrayez les pages en appelant la méthode extract() de PagesApi et en passant le paramètre ExtractRequest.

L’extrait de code suivant montre comment extraire des pages de fichiers Word en appliquant une plage et un mode de pages à l’aide de Java :

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Extrayez les pages du fichier Word en Java en utilisant la plage de numéros de page.
public class App {

	public static void main(String[] args) {
		
		// Créez une instance de l'API Pages.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Préparer les réglages
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extracteur de documents Word en ligne gratuit

Comment extraire gratuitement les pages d’un document Word ? Veuillez essayer l’extracteur de page Word en ligne pour extraire gratuitement des pages spécifiques de documents Word. Cet outil d’extraction de pages Word en ligne est développé à l’aide des API Groupdocs.Merger Cloud mentionnées ci-dessus.

Conclusion

En conclusion, le GroupDocs.Merger Cloud SDK pour Java est un excellent choix qui peut aider les développeurs à extraire des pages de documents Word en ligne. Voici ce que vous avez appris dans cet article :

  • comment extraire des pages de documents Word par numéro de page à l’aide de Java ;
  • télécharger et télécharger par programme le document Word sur le cloud ;
  • extraire les pages Word DOCX en Java en utilisant la plage exacte des numéros de page ;
  • et extrayez gratuitement des pages de Word à l’aide d’un outil d’extraction de pages Word en ligne.

De plus, nous fournissons également une section de référence API qui vous permet de visualiser et de communiquer avec nos API directement via le navigateur. Le code source complet de Java SDK est disponible gratuitement sur Github. Veuillez consulter le SDK GroupDocs.Merger Cloud pour Java Exemples ici.

De plus, nous vous suggérons de suivre notre Guide de démarrage pour les étapes détaillées et l’utilisation de l’API.

Enfin, nous continuons à écrire de nouveaux articles de blog sur différentes opérations de document à l’aide de l’API REST. Alors, s’il vous plaît contactez-nous pour les mises à jour régulières.

poser une question

Si vous avez des questions sur la façon d’extraire des pages de document, n’hésitez pas à nous les poser sur le Forum d’assistance gratuit.

FAQ

Comment extraire des pages d’un document Word en ligne en Java ?

Vous pouvez extraire des pages d’un fichier Word à l’aide de GroupDocs.Merger Cloud SDK for Java et rationaliser votre flux de travail.

Puis-je extraire des pages spécifiques à l’aide de l’API REST ?

Oui, vous pouvez spécifier le numéro de page dans un format de tableau pour extraire des pages spécifiques à l’aide de GroupDocs.Merger Cloud SDK for Java.

Quels formats de fichiers sont pris en charge par GroupDocs.Merger Cloud SDK pour Java ?

GroupDocs.Merger Cloud SDK pour Java prend en charge un large éventail de formats de fichiers, notamment Word, Excel, JPG, PowerPoint, PDF, HTML et bien d’autres.

Puis-je extraire plusieurs pages d’un fichier Word à l’aide du SDK Cloud GroupDocs.Merger pour Java ?

Oui, vous pouvez extraire plusieurs pages d’un document Word à l’aide de GroupDocs.Merger Cloud SDK for Java en spécifiant la plage de pages que vous souhaitez extraire.

Voir également

Voici quelques articles connexes qui pourraient vous être utiles :