Extraer imágenes de PowerPoint de un documento de Word - Extractor de Imágenes

Si tiene un requisito para extraer imágenes incrustadas de documentos de Word para archivar, automatización o reconocimiento de imágenes, entonces nuestra API REST de Node.js ofrece una solución robusta y basada en la nube para extraer imágenes de .doc y .docx archivos sin necesidad de tener Microsoft Word instalado.

La necesidad de extracción de imágenes también puede ocurrir si necesitamos:

  • Captura gráficos, tablas y fotos incrustadas en informes.
  • Automatizar la extracción de documentos escaneados o plantillas.
  • Construir conjuntos de datos de imágenes a partir de repositorios de documentos.
  • Preprocess content for OCR or AI tasks.

Exploremos los siguientes temas en más detalles:

API de Extracción de Imágenes de Documentos de Word

El GroupDocs.Parser Cloud SDK for Node.js es una solución basada en REST que ofrece las capacidades para analizar documentos de MS Word para la manipulación de contenido. No solo documentos de Word, sino que también ofrece apoyo para la extracción de contenido de casi todos los formatos de documentos comerciales comunes, incluidos (PPTX, Excel, PDF, ZIP, etc.).

Requisitos previos

npm install groupdocs-parser-cloud
  • Para obtener más información sobre las credenciales del cliente, visite este article.

Cómo extraer imágenes de Word usando Node.js

Sigue estos pasos para desarrollar una aplicación simple y robusta para extraer imágenes de un documento de MS Word utilizando la API de Node.js:

Paso 1: Inicializar la Configuración.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Paso 2: Configurar la información del archivo y las opciones de imagen. Inicializa un objeto de la clase ImagesRequest y pasa la instancia de la clase ImagesOptions.

const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Paso 3: Extraer imágenes del documento de Word. Invoca el images método para extraer imágenes del documento de Word en línea.

parserApi.images(request).then((response) => {
    console.log("The Word document Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Para más ejemplos, por favor visita https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.images(request).then((response) => {
  console.log("The Word document Images extracted successfully.");
  console.log(response.images);
}).catch(err => {
    console.error("Failed to extract images:", err);
});

Puedes ver el resultado del código de muestra anterior en la imagen de abajo:

Una vista previa de la extracción de imágenes de documentos de Word utilizando la API de Node.js

Extraer imágenes de Word a través de cURL

Si prefieres un enfoque de línea de comandos para extraer imágenes de documentos de Word utilizando comandos cURL, entonces GroupDocs.Parser Cloud admite estas capacidades. Exploremos más a fondo esta característica para simplificar el requisito sobre cómo obtener imágenes de un documento de Word utilizando comandos cURL.

Paso 1 – Generar Token de Acceso:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Paso 2 – Extraer imágenes del archivo de Word:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • 🔐 Reemplace con el que generó.
  • En caso de que necesite extraer las imágenes del documento completo, simplemente ignore los parámetros StartPageNumber y CountPagesToExtract.

Prueba el extractor de imágenes de palabras gratuito en línea

Si prefieres un enfoque basado en UI para extraer las imágenes del documento de Word, entonces puedes considerar usar nuestro extractor de imágenes de documento de Word en línea gratuito Word Document Image Extractor impulsado por GroupDocs.Parser Cloud.

Extractor de Imágenes Gratis

Conclusión

Con el SDK de GroupDocs.Parser Cloud para Node.js, extraer imágenes de archivos de Word se vuelve rápido y escalable. Ya sea que necesite procesar contratos, informes o formularios escaneados, esta API le brinda control total sobre la extracción de imágenes de documentos de Word.

📚 Recursos Adicionales

Preguntas Frecuentes – FAQs

Can I extract images from specific pages in a Word document?

  • Sí. Puedes definir los parámetros StartPageNumber y CountPagesToExtract.

¿Se extraen las imágenes en formato y resolución originales?

  • Sí. La API devuelve las imágenes incrustadas tal como están en el documento.

¿Necesito tener Microsoft Word instalado?

  • No. Esta es una solución basada en la nube y funciona de manera independiente de MS Office.

¿Hay una prueba gratuita?

  • Sí. Puedes obtener 150 llamadas API gratis por mes con una cuenta de prueba. Para más información, por favor visita pricing guide.

Artículos Relacionados