Analyseur de fichiers PDF - Extraire des images de fichiers PDF en ligne en Java

PDF(Portable Document Format) est un format de fichier largement utilisé pour partager et conserver des documents en ligne. Il contient souvent différents types de contenu, notamment du texte, des images, des tableaux, etc. L’extraction de contenu spécifique à partir de fichiers PDF, tels que des images, peut être une tâche difficile sans outils fiables ni bibliothèque. L’un de ces outils est le GroupDocs.Parser Cloud SDK pour Java, qui fournit un moyen transparent et efficace d’extraire des images à partir de fichiers PDF. Dans cet article, nous allons montrer comment extraire des images de fichiers PDF en Java à l’aide de l’API REST.

Les sujets suivants seront traités dans cet article :

API Java REST pour séparer les images du PDF et de l’installation du SDK

GroupDocs.Parser Cloud SDK for Java est une bibliothèque Java puissante et polyvalente qui fournit un moyen simple et efficace d’analyser et d’extraire des données à partir de divers formats de documents, y compris des fichiers PDF. Il offre un large éventail de fonctionnalités pour l’analyse de documents, permettant aux développeurs d’extraire des images, du texte, des métadonnées et d’autres contenus. GroupDocs.Parser fournit également des SDK C#.NET, Java, PHP, Ruby et Python en tant que membres de la famille d’analyseurs de documents pour les API Cloud.

Pour commencer, vous devez inclure le SDK GroupDocs.Parser Cloud dans votre projet Java. Vous pouvez soit télécharger le fichier JAR de l’API, soit l’installer à l’aide de Maven en ajoutant le référentiel et la dépendance suivants dans le fichier pom.xml de votre projet :

Référentiel Maven :

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dépendance Maven :

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Ensuite, vous devez vous inscrire pour un compte d’essai gratuit ou acheter un plan d’abonnement sur le site Web de GroupDocs et obtenir votre clé API. Une fois que vous avez l’ID client et le secret client, ajoutez l’extrait de code ci-dessous à une application basée sur Java :

# Obtenez votre client_id et client_secret depuis https://dashboard.groupdocs.cloud après l'inscription.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Comment extraire toutes les images de fichiers PDF en Java à l’aide de l’API REST

Maintenant, écrivons les étapes et un exemple d’extrait de code pour extraire des images de fichiers PDF à l’aide du SDK Cloud GroupDocs.Parser pour Java :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe ParseApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Ensuite, définissez le chemin d’accès au document PDF d’entrée.
  • Ensuite, créez une instance de la classe ImagesOptions().
  • Ensuite, affectez fileInfo à l’option d’image setFileInfo.
  • Maintenant, créez une instance de la classe ImagesRequest() et passez le paramètre ImagesOptions.
  • Enfin, obtenez des résultats en appelant la méthode ParseApi.images() et en transmettant le paramètre ImagesRequest.

L’exemple de code suivant montre comment extraire toutes les images d’un fichier PDF en ligne dans Java à l’aide de l’API REST :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Comment extraire des images d'un fichier PDF en Java.
public class App {

	public static void main(String[] args) {
		
		// Créer une instance de l'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Préparer les réglages
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extraire des images spécifiques à partir de fichiers PDF en Java à l’aide du numéro de page

Dans cette section, nous fournirons des étapes et un extrait de code pour extraire des images spécifiques d’un fichier PDF par programmation en Java :

  • Tout d’abord, importez les classes requises dans votre fichier Java.
  • Deuxièmement, créez une instance de la classe ParseApi.
  • Troisièmement, créez une instance de la classe FileInfo.
  • Ensuite, définissez le chemin d’accès au document PDF d’entrée.
  • Ensuite, créez une instance de la classe ImagesOptions().
  • Ensuite, affectez fileInfo à l’option d’image setFileInfo.
  • Ensuite, fournissez les valeurs setStartPageNumber et setCountPagesToExtract.
  • Maintenant, créez une instance de la classe ImagesRequest() et passez le paramètre ImagesOptions.
  • Enfin, obtenez des résultats en appelant la méthode ParseApi.images() et en transmettant le paramètre ImagesRequest.

L’exemple de code suivant montre comment extraire des images spécifiques d’un fichier PDF par plage de pages en Java à l’aide de l’API REST :

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extrayez des images d'un fichier PDF en ligne par plage de pages en Java.
public class App {

	public static void main(String[] args) {
		
		// Créer une instance de l'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Préparer les paramètres
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Obtenir le chemin du fichier de sortie
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extracteur d’images en ligne gratuit

Quel est le meilleur moyen d’extraire gratuitement des images d’un PDF en ligne ? Veuillez essayer un analyseur de fichiers PDF en ligne pour extraire des images de fichiers PDF. Ce logiciel PDF Parser est développé à l’aide de la bibliothèque d’analyse Java mentionnée ci-dessus.

Conclusion

En conclusion, GroupDocs.Parser Cloud SDK pour Java fournit une solution fiable et efficace pour extraire facilement des images à partir de fichiers PDF. Voici ce que vous avez appris de cet article :

  • comment extraire toutes les images des fichiers PDF par programmation en Java à l’aide de l’API REST ;
  • comment extraire des images spécifiques de documents PDF en Java à l’aide de l’API REST ;
  • et un outil d’extraction d’images en ligne pour extraire des images de documents PDF.

De plus, vous pouvez en savoir plus sur l’API GroupDocs.Parser Cloud à l’aide de la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur. Le code source complet de Java SDK est disponible gratuitement sur Github.

Enfin, nous continuons à écrire de nouveaux articles de blog sur différents formats de fichiers et à les analyser à l’aide de l’API REST. Alors, s’il vous plaît contactez-nous pour les dernières mises à jour.

poser une question

Si vous avez des questions sur la façon d’analyser des documents, n’hésitez pas à nous contacter via notre forum.

FAQ

Comment analyser des fichiers PDF à l’aide de Java ?

Pour extraire des images, du texte ou des métadonnées, vous devez d’abord charger et analyser le document PDF à l’aide de GroupDocs.Parser Cloud SDK. Ce processus implique de spécifier le chemin du fichier et d’appeler la méthode Parse pour analyser les fichiers PDF.

Le SDK GroupDocs.Parser Cloud pour Java prend-il en charge d’autres formats de fichiers que PDF ?

Oui, outre les fichiers PDF, GroupDocs.Parser Cloud SDK for Java prend en charge l’extraction d’images à partir de divers formats de documents, notamment Word, Excel, PowerPoint, HTML et bien d’autres.

Puis-je extraire toutes les images d’un fichier PDF à l’aide du SDK Cloud GroupDocs.Parser pour Java ?

Oui, vous pouvez extraire toutes les images d’un fichier PDF à l’aide du GroupDocs.Parser Cloud SDK for Java.

Voir également

Voici quelques articles connexes qui pourraient vous être utiles :