
Dans cet article, vous apprendrez comment extraire des images de manière programmatique à partir de PDF en utilisant Node.js et la puissante API REST GroupDocs.Parser Cloud. Que vous soyez en train de créer un analyseur de contenu, un outil d’extraction de données ou un système d’automatisation de documents, l’extraction d’images intégrées à partir de PDF est une exigence courante. Ce guide couvre l’installation, l’utilisation et des extraits de code pour une extraction facile d’images.
Pourquoi extraire des images d’un PDF ?
- Extraire des logos, des infographies et des photos intégrées à partir de fichiers PDF.
- Automatiser la numérisation de documents pour l’archivage et le traitement des données.
- Construisez des analyseurs PDF personnalisés ou des pipelines de reconnaissance d’images.
- Flux de travail basé sur une API REST — Pas besoin de logiciel de bureau.
Dans cet article, nous allons aborder les sujets suivants :
- API de traitement PDF
- Extraire des images d’un PDF en utilisant Node.js
- Extraire des images d’un PDF via cURL
- Extracteur d’images en ligne
API de traitement PDF
GroupDocs.Parser Cloud SDK for Node.js est un wrapper API léger et facile à intégrer qui permet aux développeurs d’extraire du contenu structuré—comme du texte, des images, des métadonnées et des champs de document—à partir d’une grande variété de formats de fichiers, y compris PDF, Word, Excel, et plus encore.
Conditions préalables Installer le SDK GroupDocs.Parser Cloud pour Node.js :
npm install groupdocs-parser-cloud
Créez un compte sur le GroupDocs.Cloud Dashboard pour obtenir votre ID client et votre secret client pour l’authentification. Pour plus d’informations, veuillez consulter cet article.
Extraire des images d’un PDF en utilisant Node.js
Suivez ces étapes pour développer votre propre extracteur d’images à partir de PDF en utilisant l’API Node.js :
Étape 1 : Configurer la configuration.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Étape 2 : Définir les informations sur le fichier PDF et les options d’extraction d’images. Initialisez un objet de la classe ImagesRequest et passez l’instance de la classe ImagesOptions.
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Étape 3 : Extraire des images. Faites appel à la images méthode pour extraire des images du fichier PDF.
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// Pour plus d'exemples, veuillez visiter https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
parserApi.images(request).then((response) => {
console.log("Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
Vous pouvez voir la sortie de l’exemple de code ci-dessus dans l’image ci-dessous :

Extraire des images d’un PDF via cURL
Vous pouvez également extraire des images en utilisant l’API REST GroupDocs.Parser et cURL.
Étape 1 – Générer le jeton d’accès :
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Étape 2 – Extraire des images via l’API REST :
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- Remplacez par celui que vous avez généré.
Extracteur d’images en ligne
Si vous recherchez une solution sans code, vous pouvez utiliser le service en ligne gratuit PDF Image Extractor propulsé par GroupDocs.Parser Cloud .

Conclusion
Le SDK GroupDocs.Parser Cloud pour Node.js rend l’extraction d’images à partir de documents PDF rapide, évolutif et convivial. Que vous construisiez des scripts d’automatisation, des crawlers de contenu ou des outils d’analyse basés sur des images, cette API REST offre tout ce dont vous avez besoin pour isoler et exporter des images de manière programmatique.
Prêt à l’intégrer dans votre flux de travail ? Commencez dès aujourd’hui avec votre premier appel d’API !
📚 Ressources complémentaires
Questions Fréquemment Posées – FAQs
How do I extract images from Word?
Vous pouvez utiliser GroupDocs.Parser Cloud SDKs pour extraire des images de fichiers PDF de manière programmatique. Veuillez visiter ce lien pour plus de détails.
What is the pricing model?
Nous proposons un modèle de tarification à l’utilisation. Pour plus d’informations, veuillez visiter pricing guide.