Come estrarre pagine da file PDF utilizzando l'API Rest in Node.js

Potrebbe essere necessario estrarre più pagine da PDF contemporaneamente in modo programmatico. Separando le pagine PDF, puoi facilmente esportare e salvare pagine specifiche di documenti PDF da condividere con le parti interessate. In qualità di sviluppatore Node.js, puoi estrarre più pagine da documenti PDF sul cloud. In questo articolo, dimostreremo come estrarre pagine da file PDF utilizzando Rest API in Node.js.

I seguenti argomenti devono essere trattati in questo articolo per estrarre le pagine dal PDF:

API REST dell’estrattore PDF e SDK Node.js
Estrai le pagine PDF in base ai numeri di pagina esatti utilizzando l’API REST in Node.js
Estrai pagine da PDF per intervallo di pagine utilizzando l’API REST in Node.js

API REST di PDF Extractor e Node.js SDK

Per estrarre pagine da PDF Adobe Acrobat, utilizzerò l’API Node.js SDK di GroupDocs.Merger Cloud. È una libreria di download gratuito di estrattori di pagine PDF online. Consente di dividere, unire, estrarre, rimuovere e riorganizzare una singola pagina o una raccolta di pagine da formati di documenti supportati di Word, Excel, PowerPoint, Disegni Visio, PDF e HTML.

Puoi installare GroupDocs.Merger cloud per estrarre pagine PDF da file PDF nella tua applicazione Node.js utilizzando il seguente comando nella console:

npm install groupdocs-merger-cloud

Si prega di ottenere l’ID cliente e il segreto dalla dashboard prima di seguire i passaggi menzionati. Una volta che hai il tuo ID e segreto, aggiungi il codice come mostrato di seguito:

# Importa l'SDK Node.js nell'applicazione del nodo da http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// ottenere clientId e clientSecret da https://dashboard.groupdocs.cloud (è richiesta la registrazione gratuita).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Estrai le pagine PDF in base ai numeri di pagina esatti utilizzando l’API REST in Node.js

Puoi esportare una singola pagina da PDF o esportare pagine specifiche da file PDF in modo programmatico sul cloud seguendo i semplici passaggi indicati di seguito:

Carica il file PDF nel Cloud
Estrai pagine PDF utilizzando l’API REST in Node.js
Scarica i file separati

Carica il file PDF

Puoi iniziare importando il file PDF nel cloud utilizzando l’esempio di codice fornito di seguito:

// apri il file in IOStream dall'unità di sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// leggi file
fs.readFile(resourcesFolder, (err, fileStream) => {
  // costruire FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // creare richiesta di file di caricamento
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // caricare un file
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Il file PDF sarà disponibile quando il file viene caricato nella sezione file della tua dashboard sul cloud.

Estrai pagine PDF utilizzando l’API REST in Node.js

I passaggi seguenti ti insegneranno come estrarre in modo programmatico le pagine dal file PDF:

Innanzitutto, crea un’istanza di PagesApi.
Crea un’istanza di ExtractOptions.
Crea un’istanza di FileInfo.
Quindi, imposta il percorso del file PDF di input.
Successivamente, imposta il percorso del file PDF estratto.
Imposta numeri di pagina specifici in un array separato da virgole per estrarre i file PDF.
Crea ExtractRequest con ExtractOptions.
Infine, chiama il metodo pagesApi.extract() con ExtractRequest per ottenere i risultati.

Il seguente frammento di codice mostra come estrarre le pagine PDF in file separati utilizzando l’API REST in Node.js:

// Come estrarre le pagine PDF in base ai numeri di pagina esatti utilizzando l'API REST in Node.js
const extractpdfpages = async () => {

  // inizializzazione dell'API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definire le opzioni di estrazione
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // creare richiesta di estrazione
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // estrarre le pagine dal documento pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Scarica i file estratti

L’esempio di codice precedente salverà i file separati nel cloud. Puoi scaricarli utilizzando il seguente esempio di codice:

// costruire FileApi per scaricare il file unito
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// creare una richiesta di download del file
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// scarica il file e il tipo di risposta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // salvare il file nella directory di sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Estrai pagine da PDF per intervallo di pagine utilizzando l’API REST in Node.js

È possibile estrarre e salvare pagine da un PDF separatamente fornendo un intervallo di numeri di pagina a livello di codice seguendo i passaggi indicati di seguito:

Innanzitutto, crea un’istanza di PagesApi.
Crea un’istanza di ExtractOptions.
Crea un’istanza di FileInfo.
Quindi, imposta il percorso del file PDF di input.
Successivamente, imposta il percorso del file PDF estratto.
Impostare i valori del numero della pagina iniziale e del numero della pagina finale.
Quindi, imposta rangeMode come EvenPages o OddPages
Crea ExtractRequest con ExtractOptions.
Infine, chiama il metodo pagesApi.extract() con ExtractRequest per ottenere i risultati.

Il seguente frammento di codice mostra come estrarre pagine da PDF online utilizzando l’intervallo di pagine e la modalità pagina in Node.js:

// Come estrarre pagine da PDF per intervallo di pagine utilizzando l'API REST in Node.js
const extractpages = async () => {

  // inizializzazione dell'API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definire le opzioni di estrazione
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // creare richiesta di estrazione
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // estrarre pagine di file PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

Allo stesso modo, puoi estrarre pagine dispari da documenti PDF.

Prova in linea

Come estrarre pagine da file PDF online? Prova il seguente strumento di estrazione PDF online gratuito per estrarre pagine da PDF online gratuitamente. Questo strumento online gratuito per l’estrazione di pagine PDF è stato sviluppato utilizzando l’API di cui sopra.

Conclusione

Stiamo concludendo questo post sul blog qui. In questo articolo hai imparato:

come estrarre determinate pagine da PDF o estrarre una pagina da PDF online utilizzando l’API REST;
come estrarre pagine da documenti PDF utilizzando l’intervallo di pagine e il filtro modalità intervallo;
carica il file PDF nel cloud per esportare le pagine selezionate dal PDF online;
scaricare e salvare determinate pagine di PDF dal cloud;
come estrarre pagine da PDF gratis;

Ora sai come estrarre una pagina da un documento PDF o come salvare determinate pagine di un PDF. L’API consente inoltre di riordinare o sostituire le pagine del documento, modificare l’orientamento della pagina, gestire le password del documento ed eseguire facilmente altre manipolazioni per qualsiasi formato di file supportato. Inoltre, puoi saperne di più su GroupDocs.Merge Cloud API utilizzando la documentazione. Forniamo anche una sezione API Reference che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser.

Inoltre, ti consigliamo di fare riferimento alla nostra Guida introduttiva.

Inoltre, groupdocs.cloud scrive regolarmente articoli su nuovi argomenti. Quindi, per favore, resta in contatto per gli ultimi aggiornamenti.

Fai una domanda

Puoi porre le tue domande su come estrarre file PDF per esportare pagine selezionate da PDF, tramite il nostro Forum di supporto gratuito

Domande frequenti

Come estrarre più pagine da PDF in un unico file?

Installa JS library per separare i file PDF in più pagine online in modo programmatico. Puoi visitare la documentazione per i dettagli completi dell’API.

Quanto tempo ci vuole per estrarre pagine specifiche da PDF?

JavaScript HTML to PDF library funziona molto velocemente e puoi estrarre pagine da PDF protetti facilmente in pochi secondi.

Guarda anche

Per la migliore lettura e informazioni, si prega di visitare i seguenti articoli:

API REST di PDF Extractor e Node.js SDK#

Estrai le pagine PDF in base ai numeri di pagina esatti utilizzando l’API REST in Node.js#

Carica il file PDF#

Estrai pagine PDF utilizzando l’API REST in Node.js#

Scarica i file estratti#

Estrai pagine da PDF per intervallo di pagine utilizzando l’API REST in Node.js#

Prova in linea#

Conclusione#

Fai una domanda#

Domande frequenti#

Guarda anche#