Extraer imágenes de Word en Node.js - Extractor de archivos de imagen

Los archivos DOCX/DOC pueden contener datos textuales y visuales masivos en muchos escenarios. Si necesita extraer todas las imágenes del archivo de Word y separar las imágenes de los datos textuales, puede aprovechar las API SDK y REST de la nube con tecnología de GroupDocs.Parser. De hecho, puede crear un extractor de archivos de imagen en JavaScript utilizando los métodos expuestos en GroupDocs.Parser Cloud SDKs para Node.js. Entonces, avancemos y exploremos cómo extraer imágenes de Word en Node.js. Además, repasaremos los pasos y el fragmento de código para implementar la funcionalidad.

Se cubrirán los siguientes puntos:

Instalación del software de procesamiento de textos

El paso de instalación de cualquier biblioteca juega un papel vital en el desarrollo rápido de aplicaciones. Afortunadamente, el proceso de instalación de GroupDocs.Parser Cloud SDKs para Node.js es como instalar cualquier módulo de Node.js usando npm install MODULENAME. Entonces, ejecute el siguiente comando para instalar esta biblioteca extractora de archivos de imágenes con muchas funciones:

npm install groupdocs-parser-cloud

En la siguiente fase, configuraremos esta biblioteca con nuestro proyecto Node.js. Para ello, obtendremos las credenciales API (Client ID, Client Secret) de nuestro API Cloud dashboard.

Visite esta guía en caso de que encuentre alguna dificultad para obtener las credenciales de API.

Extraer imágenes de Word en Node.js

Tenemos un archivo DOC/DOCX de origen en nuestro panel de API Cloud que puede cargar de forma manual o mediante programación llamando al método UploadFile.

Los siguientes pasos demuestran cómo extraer imágenes de Word en Node.js:

  • Obtenga groupdocs-parser-cloud en su proyecto.
  • Cree una instancia de la clase Configuración con el ID del cliente y el Secreto del cliente.
  • Invoque el método fromConfig y pase el objeto de la clase Configuración.
  • Cree un objeto de la clase FileInfo y defina la ruta del archivo DOCX de origen.
  • Defina opciones de imagen creando una instancia de la clase ImagesOptions.
  • Inicialice un objeto de la clase ImagesRequest y pase la instancia de la clase ImagesOptions.
  • Invoque el método imágenes para extraer imágenes de un documento de Word.

Copie y pegue el siguiente fragmento de código para crear su propio software de procesamiento de textos:

// Obtenga groupdocs-parser-cloud en su proyecto.
const groupdocs_parser_cloud = require("groupdocs-parser-cloud");
// Defina sus credenciales API.
let clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
let clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
// Cree una instancia de la clase de configuración con el ID del cliente y el secreto del cliente.
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
// Invoque el método fromConfig y pase el objeto de la clase Configuración.
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// Cree un objeto de la clase FileInfo y defina la ruta del archivo DOCX de origen.
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// Defina opciones de imagen creando una instancia de la clase ImagesOptions.
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// Inicialice un objeto de la clase ImagesRequest y pase la instancia de la clase ImagesOptions.
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// Invoque el método de imágenes para extraer imágenes de un documento de Word.
parseApi.images(request)
.then((result)=>{
// Mostrar resultados
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
})

Puede ver el resultado del ejemplo de código anterior en la siguiente imagen:

extractor de archivos de imagen

Extractor de imágenes en línea

Puede hacer pleno uso de esta herramienta en línea para extraer imágenes de archivos de Word. Sobre todo, también está respaldado por GroupDocs.Parser Cloud SDKs. Además, está basado en la web y ofrece sólidas funciones de conversión y manipulación, ya que es gratuito y no requiere creación de cuenta ni suscripción.

Extractor de imágenes en línea

Conclusión

Al final, podemos considerar con seguridad GroupDocs.Parser Cloud SDK para desarrollar un software de procesamiento de textos. Es bastante fácil de instalar y configurar y hay una gran cantidad de métodos que puedes invocar. Además, existe un extractor de imágenes en línea para lograr la funcionalidad en línea. Visite la documentación y el repositorio GitHub para una mayor exploración. Además, no dude en visitar la Guía de introducción para iniciar el desarrollo.

Finalmente, groupdocs.cloud está escribiendo nuevos artículos. Por lo tanto, manténgase en contacto para recibir actualizaciones periódicas.

Hay ayuda disponible

Puedes dejarnos saber tus dudas o consultas en nuestro foro.

Preguntas frecuentes – Preguntas frecuentes

¿Cómo extraigo imágenes de Word?

Puede utilizar GroupDocs.Parser Cloud SDKs para extraer imágenes de archivos DOCX/DOC mediante programación. Visite este enlace para obtener más detalles.

Ver también