Extraer imágenes de PDF en Node.js - Extractor de imágenes

En este artículo, aprenderás cómo extraer programáticamente imágenes de PDF archivos utilizando Node.js y la poderosa API REST de GroupDocs.Parser Cloud. Ya sea que estés construyendo un analizador de contenido, una herramienta de extracción de datos o un sistema de automatización de documentos, extraer imágenes incrustadas de PDFs es un requisito común. Esta guía cubre la instalación, el uso y fragmentos de código para una fácil extracción de imágenes.

¿Por qué extraer imágenes de un PDF?

  • Extraer logotipos, infografías y fotos incrustadas de PDFs.
  • Automatizar la digitalización de documentos para archivo y procesamiento de datos.
  • Construya analizadores de PDF personalizados o tuberías de reconocimiento de imágenes.
  • Flujo de trabajo basado en API REST — No es necesario software de escritorio.

En este artículo, vamos a cubrir los siguientes temas:

API de Procesamiento de PDF

GroupDocs.Parser Cloud SDK for Node.js es un envoltorio de API ligero y fácil de integrar que permite a los desarrolladores extraer contenido estructurado, como texto, imágenes, metadatos y campos de documentos, de una amplia variedad de formatos de archivo, incluidos PDF, Word, Excel y más.

Requisitos previos Instalar el SDK de GroupDocs.Parser Cloud para Node.js:

npm install groupdocs-parser-cloud

Crea una cuenta en el GroupDocs.Cloud Dashboard para obtener tu Client ID y Client Secret para autenticación. Para más información, visita este article.

Extraer imágenes de PDF usando Node.js

Sigue estos pasos para desarrollar tu propio extractor de imágenes de PDF utilizando la API de Node.js:

Paso 1: Configurar la configuración.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Paso 2: Definir la información del archivo PDF y las opciones de extracción de imágenes. Inicializa un objeto de la clase ImagesRequest y pasa la instancia de la clase ImagesOptions.

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Paso 3: Extraer Imágenes. Invoca el images método para extraer imágenes del archivo PDF.

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Para más ejemplos, por favor visita https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

Puedes ver la salida del ejemplo de código anterior en la imagen a continuación:

extractor de archivos de imagen

Extraer imágenes de PDF a través de cURL

También puedes extraer imágenes utilizando la API REST de GroupDocs.Parser y cURL.

Paso 1 – Generar Token de Acceso:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Paso 2 – Extraer imágenes a través de la API REST:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Reemplace con el que generó.

Extractor de Imágenes en Línea

Si estás buscando una solución sin código, puedes usar el extractor de imágenes PDF en línea gratuito PDF Image Extractor impulsado por GroupDocs.Parser Cloud.

Extractor de Imágenes en Línea

Conclusión

El SDK de GroupDocs.Parser Cloud para Node.js hace que la extracción de imágenes de documentos PDF sea rápida, escalable y amigable con el código. Ya sea que estés creando scripts de automatización, rastreadores de contenido o herramientas de análisis basadas en imágenes, esta API REST ofrece todo lo que necesitas para aislar y exportar imágenes de manera programática.

¿Listo para integrarlo en tu flujo de trabajo? ¡Comienza con tu primera llamada a la API hoy!

📚 Recursos Adicionales

Preguntas Frecuentes – FAQs

How do I extract images from Word?

Puedes utilizar GroupDocs.Parser Cloud SDKs para extraer imágenes de archivos PDF programáticamente. Por favor visita este link para más detalles.

¿Qué es el modelo de precios?

Ofrecemos un modelo de precios de pago por uso. Para más información, por favor visita pricing guide.

Artículos relacionados