Comment extraire des pages PDF en Java

Extraire des pages d’un PDF en Java - Séparer les pages PDF en ligne.

Si vous travaillez avec des fichiers PDF, vous pouvez vous retrouver dans une situation où vous devez extraire des pages d’un fichier PDF. L’extraction de pages d’un fichier PDF peut être une tâche fastidieuse, surtout si vous devez le faire manuellement ou traiter des documents volumineux. Heureusement, avec l’aide de GroupDocs.Merger Cloud SDK pour Java, vous pouvez facilement extraire des pages d’un fichier PDF par programme. Dans cet article, nous allons explorer comment extraire des pages d’un PDF en Java.

Les sujets suivants seront traités dans cet article :

Installation de l’API REST et du SDK de l’extracteur de pages PDF Java

GroupDocs.Merger Cloud SDK for Java est une API basée sur le cloud qui permet aux développeurs de fusionner, extraire, diviser, réorganiser et supprimer des pages de fichiers et d’autres types de documents, y compris Word, Excel , PowerPoint, HTML, PDF et bien d’autres. Ce puissant SDK est facile à utiliser et peut être intégré dans une application basée sur Java pour automatiser les tâches de manipulation de fichiers.

Vous pouvez soit télécharger le fichier JAR de l’API, soit l’installer à l’aide de Maven en ajoutant le référentiel et la dépendance suivants dans le fichier pom.xml de votre projet :

Référentiel Maven :

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dépendance Maven :

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Maintenant, vous devez vous inscrire pour un compte d’essai gratuit ou acheter un plan d’abonnement sur le site Web de GroupDocs pour obtenir votre clé API. Une fois que vous avez l’ID client et le secret client, ajoutez l’extrait de code ci-dessous à une application basée sur Java :

# Obtenez votre client_id et client_secret depuis https://dashboard.groupdocs.cloud après l'inscription.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Comment extraire des pages PDF par numéros de page exacts en Java

Pour extraire des pages d’un fichier PDF à l’aide de GroupDocs.Merger Cloud SDK for Java, vous devrez suivre ces étapes :

Télécharger les fichiers

Tout d’abord, téléchargez le fichier PDF dans le cloud en utilisant l’exemple de code ci-dessous :

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Télécharger le fichier sur le Cloud Storage à l'aide de Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Par conséquent, le fichier PDF téléchargé sera disponible dans la section des fichiers de votre tableau de bord sur le cloud.

Extraire des pages de fichiers PDF en Java

Voici un guide étape par étape et un exemple d’extrait de code expliquant comment extraire des pages d’un fichier PDF à l’aide de GroupDocs.Merger Cloud SDK pour Java :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe PagesApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Après cela, définissez le chemin du fichier d’entrée source.
  • Maintenant, créez une instance de la classe ExtractOptions().
  • Ensuite, définissez les options d’extraction setFileInfo, setOutputPath et la collection setPages au format tableau.
  • Maintenant, créez une instance de la classe ExtractRequest() et transmettez le paramètre ExtractOptions.
  • Enfin, extrayez les pages en appelant la méthode extract() de PagesApi et en passant le paramètre ExtractRequest.

L’extrait de code suivant montre comment séparer les fichiers PDF en pages individuelles dans Java à l’aide de l’API REST :

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Comment extraire des pages PDF par numéros de page exacts en Java.
public class App {

	public static void main(String[] args) {

		// Créez une instance de l'API Pages.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Préparer les réglages
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Télécharger le fichier

L’exemple de code ci-dessus enregistrera des pages spécifiques de PDF sur le cloud. Vous pouvez le télécharger à l’aide de l’exemple de code suivant :

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Télécharger le fichier à partir du Cloud Storage à l'aide de Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Comment extraire des pages d’un PDF par plages de pages à l’aide de Java

Dans cette section, nous couvrirons un guide étape par étape et un exemple d’extrait de code pour enregistrer les pages sélectionnées du PDF à l’aide de Java en appliquant la plage de pages :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe PagesApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Après cela, définissez le chemin du fichier d’entrée source.
  • Maintenant, créez une instance de la classe ExtractOptions().
  • Ensuite, définissez les options d’extraction setFileInfo, setOutputPath, setStartPageNumber et setEndPageNumber.
  • Ensuite, définissez les options de page setRangeMode sur EVENPAGES.
  • Maintenant, créez une instance de la classe ExtractRequest() et transmettez le paramètre ExtractOptions.
  • Enfin, extrayez les pages en appelant la méthode extract() de PagesApi et en passant le paramètre ExtractRequest.

L’extrait de code suivant montre comment extraire des pages PDF en appliquant une plage et un mode de pages en Java :

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Comment extraire des pages d'un PDF par plages de pages à l'aide de Java.
public class App {

	public static void main(String[] args) {
		
		// Créez une instance de l'API Pages.		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Préparer les paramètres
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extracteur de pages PDF en ligne gratuit

Comment extraire des pages PDF gratuitement ? Veuillez essayer l’extracteur de pages PDF gratuit pour extraire gratuitement des pages spécifiques d’un PDF. Cet extracteur de pages PDF en ligne est développé à l’aide des API Groupdocs.Merger Cloud mentionnées ci-dessus.

Conclusion

GroupDocs.Merger Cloud SDK pour Java fournit un moyen simple d’extraire des pages PDF vers un nouveau PDF en Java. Voici ce que vous avez appris dans cet article :

  • comment séparer les fichiers PDF en plusieurs pages par numéro à l’aide de Java ;
  • télécharger et télécharger par programme le fichier PDF à l’aide de Java sur le cloud ;
  • séparer le PDF en pages individuelles en Java à l’aide de plages de pages ;
  • et extrayez gratuitement des pages de PDF en ligne à l’aide d’un extracteur de pages PDF gratuit en ligne.

De plus, nous fournissons également une section API Reference qui vous permet de visualiser et de communiquer avec nos API directement via le navigateur. Le code source complet de Java SDK est disponible gratuitement sur Github. Veuillez consulter le SDK GroupDocs.Merger Cloud pour Java Exemples ici.

De plus, nous vous suggérons de suivre notre Guide de démarrage pour les étapes détaillées et l’utilisation de l’API.

Enfin, nous continuons à écrire de nouveaux articles de blog sur différentes opérations de document à l’aide de l’API REST. Alors, s’il vous plaît contactez-nous pour les mises à jour régulières.

poser une question

Si vous avez des questions sur l’API d’extraction de pages PDF, n’hésitez pas à nous les poser sur le Forum d’assistance gratuit.

FAQ

Comment extraire des pages d’un fichier PDF en Java ?

Vous pouvez extraire des pages d’un fichier PDF à l’aide de GroupDocs.Merger Cloud SDK for Java.

Est-il possible d’exporter une seule page de PDF en Java ?

Oui, vous pouvez extraire des pages PDF dans des fichiers uniques par programmation en Java à l’aide de GroupDocs.Merger Cloud SDK for Java.

De quels formats de fichiers puis-je extraire des pages à l’aide du SDK Cloud GroupDocs.Merger pour Java ?

En plus des fichiers PDF, GroupDocs.Merger Cloud SDK pour Java peut extraire des pages de Microsoft Word, Excel, PowerPoint, HTML et d’autres formats de fichiers.

Voir également

Voici quelques articles connexes qui pourraient vous être utiles :