Comment extraire des pages d'un fichier PDF à l'aide de l'API Rest dans Node.js

Comment extraire des pages de fichiers PDF à l’aide de l’API Rest dans Node.js

Vous devrez peut-être extraire plusieurs pages de PDF à la fois par programmation. En séparant les pages PDF, vous pouvez facilement exporter et enregistrer des pages spécifiques de documents PDF à partager avec les parties prenantes. En tant que développeur Node.js, vous pouvez extraire plusieurs pages de documents PDF sur le cloud. Dans cet article, nous allons montrer comment extraire des pages d’un fichier PDF à l’aide de l’API Rest dans Node.js.

Les sujets suivants doivent être couverts dans cet article pour extraire des pages d’un PDF :

API REST de l’extracteur de PDF et SDK Node.js

Afin d’extraire des pages de PDF Adobe Acrobat, j’utiliserai l’API Node.js SDK of GroupDocs.Merger Cloud. Il s’agit d’une bibliothèque de téléchargement gratuit d’extracteur de pages PDF en ligne. Il vous permet de diviser, combiner, extraire, supprimer et réorganiser une seule page ou un ensemble de pages à partir de formats de documents pris en charge de Word, Excel, PowerPoint, Dessins Visio, PDF et HTML.

Vous pouvez installer le cloud GroupDocs.Merger pour extraire des pages PDF à partir de fichiers PDF dans votre application Node.js à l’aide de la commande suivante dans la console :

npm install groupdocs-merger-cloud

Veuillez obtenir votre ID client et votre secret à partir du tableau de bord avant de suivre les étapes mentionnées. Une fois que vous avez votre identifiant et votre secret, ajoutez le code comme indiqué ci-dessous :

# Importez le SDK Node.js dans votre application de nœud à partir de http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// obtenez clientId et clientSecret depuis https://dashboard.groupdocs.cloud (une inscription gratuite est requise).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extraire les pages PDF par numéros de page exacts à l’aide de l’API REST dans Node.js

Vous pouvez exporter une seule page à partir d’un PDF ou exporter des pages spécifiques à partir de fichiers PDF par programmation sur le cloud en suivant les étapes simples mentionnées ci-dessous :

Télécharger le fichier PDF

Vous pouvez commencer par importer le fichier PDF dans le cloud en utilisant l’exemple de code ci-dessous :

// ouvrez le fichier dans IOStream à partir de votre lecteur système.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// lire le fichier
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construire FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // créer une demande de téléchargement de fichier
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // téléverser un fichier
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Le fichier PDF sera disponible lorsque le fichier sera téléchargé dans la section des fichiers de votre tableau de bord sur le cloud.

Extraire des pages PDF à l’aide de l’API REST dans Node.js

Les étapes ci-dessous vous apprendront comment extraire par programmation des pages d’un fichier PDF :

  • Tout d’abord, créez une instance de PagesApi.
  • Créez une instance de ExtractOptions.
  • Créez une instance de FileInfo.
  • Ensuite, définissez le chemin d’accès au fichier PDF d’entrée.
  • Ensuite, définissez le chemin d’accès au fichier PDF extrait.
  • Définissez des numéros de page spécifiques dans un tableau séparé par des virgules pour extraire les fichiers PDF.
  • Créez ExtractRequest avec ExtractOptions.
  • Enfin, appelez la méthode pagesApi.extract() avec ExtractRequest pour obtenir des résultats.

L’extrait de code suivant montre comment extraire des pages PDF dans des fichiers séparés à l’aide de l’API REST dans Node.js :

// Comment extraire des pages PDF par numéros de page exacts à l'aide de l'API REST dans Node.js
const extractpdfpages = async () => {

  // initialisation de l'API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // définir les options d'extraction
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // créer une demande d'extrait
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extraire des pages d'un document pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Télécharger les fichiers extraits

L’exemple de code ci-dessus enregistrera les fichiers séparés sur le cloud. Vous pouvez les télécharger à l’aide de l’exemple de code suivant :

// construire FileApi pour télécharger le fichier fusionné
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// créer une demande de fichier de téléchargement
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// télécharger le fichier et le type de réponse Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // enregistrer le fichier dans votre répertoire système
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extraire des pages d’un PDF par plage de pages à l’aide de l’API REST dans Node.js

Vous pouvez extraire et enregistrer des pages d’un PDF séparément en fournissant une plage de numéros de page par programmation en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de PagesApi.
  • Créez une instance de ExtractOptions.
  • Créez une instance de FileInfo.
  • Ensuite, définissez le chemin d’accès au fichier PDF d’entrée.
  • Ensuite, définissez le chemin d’accès au fichier PDF extrait.
  • Définissez les valeurs du numéro de page de début et du numéro de page de fin.
  • Ensuite, définissez le rangeMode sur EvenPages ou OddPages
  • Créez ExtractRequest avec ExtractOptions.
  • Enfin, appelez la méthode pagesApi.extract() avec ExtractRequest pour obtenir des résultats.

L’extrait de code suivant montre comment extraire des pages d’un PDF en ligne à l’aide de la plage de pages et du mode de page dans Node.js :

// Comment extraire des pages d'un PDF par plage de pages à l'aide de l'API REST dans Node.js
const extractpages = async () => {

  // initialisation de l'API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // définir les options d'extraction
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // créer une demande d'extrait
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extraire les pages du fichier PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

De la même manière, vous pouvez extraire des pages impaires de documents PDF.

Essayez en ligne

Comment extraire des pages de fichiers PDF en ligne ? Veuillez essayer outil d’extraction de PDF en ligne gratuit pour extraire gratuitement des pages de PDF en ligne. Cet outil en ligne gratuit d’extraction de pages PDF est développé à l’aide de l’API ci-dessus.

Conclusion

Nous terminons cet article de blog ici. Dans cet article, vous avez appris :

  • comment extraire certaines pages d’un PDF ou extraire une page d’un PDF en ligne à l’aide de l’API REST ;
  • comment extraire des pages de documents PDF à l’aide d’un filtre de plage de pages et de mode de plage ;
  • téléchargez le fichier PDF dans le cloud pour exporter les pages sélectionnées à partir du PDF en ligne ;
  • télécharger et enregistrer certaines pages de PDF à partir du cloud ;
  • comment extraire des pages d’un PDF gratuitement ;

Maintenant, vous savez comment extraire une page d’un document PDF ou comment enregistrer certaines pages d’un PDF. L’API vous permet également de réorganiser ou de remplacer les pages du document, de modifier l’orientation de la page, de gérer les mots de passe des documents et d’effectuer facilement d’autres manipulations pour tout format de fichier pris en charge. En outre, vous pouvez en savoir plus sur l’API GroupDocs.Merge Cloud à l’aide de la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur.

De plus, nous vous conseillons de consulter notre Guide de démarrage.

De plus, groupdocs.cloud écrit régulièrement des articles sur de nouveaux sujets. Veuillez donc rester en contact pour les dernières mises à jour.

poser une question

Vous pouvez poser vos questions sur la façon d’extraire des fichiers PDF pour exporter des pages sélectionnées à partir de PDF, via notre Forum d’assistance gratuit

FAQ

Comment extraire plusieurs pages d’un PDF en un seul fichier ?

Installez la bibliothèque JS pour séparer les fichiers PDF en plusieurs pages en ligne par programmation. Vous pouvez visiter la documentation pour obtenir des détails complets sur l’API.

Combien de temps faut-il pour extraire des pages spécifiques d’un PDF ?

Bibliothèque JavaScript HTML vers PDF fonctionne très rapidement et vous pouvez facilement extraire des pages d’un PDF protégé en quelques secondes.

Voir également

Pour une lecture et des informations optimales, veuillez consulter les articles suivants :