Estrai Immagini da PDF in Node.js - Estraitore di Immagini

In questo articolo, imparerai come estrarre programmaticamente immagini da PDF utilizzando Node.js e il potente GroupDocs.Parser Cloud REST API. Che tu stia costruendo un parser di contenuti, uno strumento di estrazione dati o un sistema di automazione documentale, l’estrazione di immagini incorporate dai PDF è un requisito comune. Questa guida tratta l’installazione, l’uso e frammenti di codice per un facile estrazione delle immagini.

Perché estrarre immagini da PDF?

  • Estrai loghi, infografiche e foto incorporate dai PDF.
  • Automatizzare la digitalizzazione dei documenti per l’archiviazione e l’elaborazione dei dati.
  • Costruisci analizzatori PDF personalizzati o pipeline di riconoscimento delle immagini.
  • Flusso basato su API REST — Nessuna necessità di software desktop.

In questo articolo, tratteremo i seguenti argomenti:

API di elaborazione PDF

GroupDocs.Parser Cloud SDK per Node.js è un wrapper API leggero e facile da integrare che consente agli sviluppatori di estrarre contenuti strutturati—come testo, immagini, metadati e campi di documento—da una vasta gamma di formati di file tra cui PDF, Word, Excel e altro ancora.

Prerequisites Installa il GroupDocs.Parser Cloud SDK per Node.js:

npm install groupdocs-parser-cloud

Crea un account presso il GroupDocs.Cloud Dashboard per ottenere il tuo Client ID e Client Secret per l’autenticazione. Per ulteriori informazioni, visita questo article.

Estrai immagini da PDF utilizzando Node.js

Segui questi passaggi per sviluppare il tuo estrattore di immagini da PDF utilizzando l’API Node.js:

Passo 1: Imposta la configurazione.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Passo 2: Definire le informazioni sul file PDF e le opzioni di estrazione delle immagini. Inizializza un oggetto della classe ImagesRequest e passa l’istanza della classe ImagesOptions.

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Passo 3: Estrai Immagini. Invoca il images metodo per estrarre immagini da un file PDF.

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Per ulteriori esempi, visita https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

Puoi vedere l’output del campione di codice sopra nell’immagine qui sotto:

extractore di file immagine

Estrai Immagini da PDF tramite cURL

Puoi anche estrarre immagini utilizzando l’API REST di GroupDocs.Parser e cURL.

Passo 1 – Genera Token di Accesso:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Step 2 – Estrai immagini tramite REST API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Sostituisci con quello che hai generato.

Online Image Extractor

Se stai cercando una soluzione senza codice, puoi utilizzare il Free Online PDF Image Extractor alimentato da GroupDocs.Parser Cloud.

Esttractore di Immagini Online

Conclusione

Il GroupDocs.Parser Cloud SDK per Node.js rende l’estrazione di immagini da documenti PDF veloce, scalabile e friendly con il codice. Che tu stia creando script di automazione, crawler di contenuti o strumenti analitici basati su immagini, questo REST API offre tutto ciò di cui hai bisogno per isolare ed esportare immagini in modo programmatico.

Pronto a integrarlo nel tuo flusso di lavoro? Inizia con la tua prima chiamata API oggi!

📚 Risorse Aggiuntive

Domande Frequenti – FAQs

Come posso estrarre immagini da Word?

Puoi utilizzare GroupDocs.Parser Cloud SDKs per estrarre immagini da file PDF in modo programmatico. Si prega di visitare questo link per ulteriori dettagli.

Qual è il modello di prezzo?

Offriamo un modello di pricing pay as you go. Per ulteriori informazioni, si prega di visitare pricing guide.

Articoli Correlati