Extraire des images des documents PDF en Java

PDF File Parser – Extraire des images des fichiers PDF en ligne en Java

PDF(Format de Document Portable) est un format de fichier largement utilisé pour partager et préserver des documents en ligne. Il contient souvent divers types de contenu, y compris du texte, des images, des tableaux, et plus encore. Extraire un contenu spécifique des fichiers PDF, comme des images, peut être une tâche difficile sans outils ou bibliothèque fiables. Un de ces outils est le GroupDocs.Parser Cloud SDK pour Java, qui offre un moyen fluide et efficace d’extraire des images des fichiers PDF. Dans cet article, nous allons démontrer comment extraire des images des fichiers PDF en Java en utilisant l’API REST.

Les sujets suivants seront abordés dans cet article :

API REST Java pour séparer les images d’un PDF et installation du SDK
Comment extraire toutes les images des fichiers PDF en Java en utilisant l’API REST
Extraire des images spécifiques des fichiers PDF en Java en utilisant le numéro de page

Java REST API pour séparer les images du PDF et installation du SDK

GroupDocs.Parser Cloud SDK pour Java est une bibliothèque Java puissante et polyvalente qui offre un moyen simple et efficace d’analyser et d’extraire des données à partir de divers formats de document, y compris les fichiers PDF. Elle offre une large gamme de fonctionnalités pour l’analyse de documents, permettant aux développeurs d’extraire des images, du texte, des métadonnées et d’autres contenus. GroupDocs.Parser fournit également des SDK C#.NET, Java, PHP, Ruby et Python en tant que membres de sa famille de parseurs de documents pour les API Cloud.

Pour commencer, vous devez inclure le SDK Cloud GroupDocs.Parser dans votre projet Java. Vous pouvez soit télécharger le fichier JAR de l’API, soit l’installer en utilisant Maven en ajoutant le dépôt et la dépendance suivants dans le fichier pom.xml de votre projet :

Dépôt Maven :

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dépendance Maven :

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Ensuite, vous devez sign up pour un compte d’essai gratuit ou purchase a subscription plan sur le site Web de GroupDocs et get your API key. Une fois que vous avez l’ID client et le secret client, ajoutez le code ci-dessous à une application basée sur Java :

# Obtenez votre clientid et clientsecret depuis https://dashboard.groupdocs.cloud après l'inscription.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Comment extraire toutes les images des fichiers PDF en Java en utilisant l’API REST

Maintenant, écrivons les étapes et un exemple de code pour extraire des images des fichiers PDF en utilisant le SDK Cloud GroupDocs.Parser pour Java :

Tout d’abord, importez les classes requises dans votre fichier Java.
Ensuite, créez une instance de la ParseApi classe.
Troisièmement, créez une instance de la FileInfo classe.
Ensuite, définissez le chemin du document PDF d’entrée.
Ensuite, créez une instance de la classe ImagesOptions().
Ensuite, attribuez fileInfo à l’option d’image setFileInfo.
Maintenant, créez une instance de la classe ImagesRequest() et passez le paramètre ImagesOptions.
Enfin, obtenez les résultats en appelant la ParseApi.images() méthode et en passant le paramètre ImagesRequest.

Le code d’exemple suivant montre comment extraire toutes les images d’un fichier PDF en ligne en Java en utilisant l’API REST :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Comment extraire des images d'un fichier PDF en Java.
public class App {

	public static void main(String[] args) {
		
		// Créer une instance de l'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Préparez les paramètres
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extraire des images spécifiques à partir de fichiers PDF en Java en utilisant le numéro de page

Dans cette section, nous fournirons des étapes et un extrait de code pour extraire des images spécifiques d’un fichier PDF de manière programmatique en Java :

Tout d’abord, importez les classes requises dans votre fichier Java.
Deuxièmement, créez une instance de la ParseApi classe.
Troisièmement, créez une instance de la FileInfo classe.
Ensuite, définissez le chemin du document PDF d’entrée.
Ensuite, créez une instance de la classe ImagesOptions().
Ensuite, attribuez fileInfo à l’option d’image setFileInfo.
Puis, fournissez les valeurs de setStartPageNumber et setCountPagesToExtract.
Maintenant, créez une instance de la classe ImagesRequest() et passez le paramètre ImagesOptions.
Enfin, obtenez les résultats en appelant la ParseApi.images() méthode et en passant le paramètre ImagesRequest.

Le code suivant montre comment extraire des images spécifiques d’un fichier PDF par plage de pages en Java en utilisant une API REST :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extract images from a PDF file online by page range in Java.
public class App {

	public static void main(String[] args) {
		
		// Créer une instance de l'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Préparer les paramètres
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extracteur d’images en ligne gratuit

What is the best way to extract images from PDF online for free? Please try an online PDF File parser to extract images from PDF files. This PDF Parser software is developed using the Java as mentioned above parser library.

Conclusion

En conclusion, le SDK Cloud GroupDocs.Parser pour Java offre une solution fiable et efficace pour extraire des images des fichiers PDF facilement. Voici ce que vous avez appris de cet article :

How to extract all images from PDF files programmatically in Java using REST API;
Comment extraire des images spécifiques de documents PDF en Java à l’aide d’une API REST ;
Outil d’extraction d’images en ligne pour extraire des images des documents PDF.

De plus, vous pouvez en apprendre davantage sur l’API Cloud de GroupDocs.Parser en consultant la documentation. Nous proposons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur. Le code source complet du SDK Java est disponible gratuitement sur Github.

Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.

Ask a question

En cas de questions sur la façon d’analyser des documents, n’hésitez pas à nous contacter via notre forum.

FAQs

How do I parse PDF files using Java?

Pour extraire des images, du texte ou des métadonnées, vous devez d’abord charger et analyser le document PDF en utilisant GroupDocs.Parser Cloud SDK. Ce processus consiste à spécifier le chemin du fichier et à appeler la méthode Parse pour analyser les fichiers PDF.

Does GroupDocs.Parser Cloud SDK for Java support other file formats besides PDF?

Oui, en plus des fichiers PDF, GroupDocs.Parser Cloud SDK for Java prend en charge l’extraction d’images à partir de divers formats de documents, y compris Word, Excel, PowerPoint, HTML, et bien d’autres.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

Oui, vous pouvez extraire toutes les images d’un fichier PDF en utilisant le GroupDocs.Parser Cloud SDK for Java.

Voir aussi

Voici quelques articles connexes que vous pourriez trouver utiles :

Java REST API pour séparer les images du PDF et installation du SDK#

Comment extraire toutes les images des fichiers PDF en Java en utilisant l’API REST#

Extraire des images spécifiques à partir de fichiers PDF en Java en utilisant le numéro de page#

Extracteur d’images en ligne gratuit#

Conclusion#

Ask a question#

FAQs#

Voir aussi#