Los documentos de Word a menudo contienen elementos visuales ricos, como logotipos, gráficos e imágenes de productos que puede que necesite reutilizar o analizar por separado. Guardar manualmente cada imagen de un .doc o .docx archivo puede ser lento y propenso a errores, especialmente al manejar documentos en masa o flujos de trabajo automatizados.
Por lo tanto, en este artículo, vamos a aprender los detalles sobre cómo podemos extraer imágenes de documentos de Word programáticamente utilizando algunas llamadas sencillas a la API. Nuestro SDK basado en REST funciona completamente en la nube, sin necesidad de Microsoft Word o bibliotecas externas, lo que lo hace ideal para la automatización, la integración y aplicaciones escalables.
Características destacadas de la extracción de imágenes
- Archivando visuales de documentos en una biblioteca de medios centralizada
- Procesando gráficos incrustados para flujos de trabajo de aprendizaje automático u OCR
- Reutilizando activos de la empresa de informes y contratos
- Migrando datos visuales entre sistemas de documentos
Exploramos los siguientes temas con más detalle:
- API de procesamiento de documentos de Word
- Cómo extraer imágenes de Word en C#
- Descargar imágenes de documentos de Word usando cURL
- Extractor de imágenes de documentos de Word gratuito
API de procesamiento de documentos de Word
El GroupDocs.Parser Cloud SDK for .NET es nuestra API basada en REST galardonada que ofrece capacidades para manipular una gran variedad de formatos de archivo, incluidos Word Document, PPTX, Excel, PDF, ZIP, etc. Según nuestros requisitos, la API simplifica estos casos de uso al permitirte leer, extraer y guardar imágenes directamente desde archivos .doc
y .docx
en tus aplicaciones C#.
Requisitos previos
- Regístrate en GroupDocs Cloud Dashboard.
- Obtén tu Client ID y Client Secret. Para más detalles, visita este article.
- Instalar el SDK basado en REST:
- Instalar .NET 6.0 o posterior y Visual Studio.
Instale el SDK desde NuGet Packages:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
- Para obtener más información sobre las credenciales del cliente,
Cómo extraer imágenes de Word en C#
Sigue el sencillo proceso de tres pasos a continuación para extraer imágenes de un documento de Word utilizando C# y la API REST de GroupDocs.Parser Cloud.
Paso 1: Inicializar la configuración de la API
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
Paso 2: Establecer la ruta del archivo y las opciones de extracción Inicializar un objeto de la clase ImagesRequest donde pasamos la instancia de la clase ImagesOptions como un argumento.
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
Paso 3: Recuperar imágenes del documento. Invoca la images API para extraer imágenes del documento de Word.
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
// write the name of image extracted from word document
Console.WriteLine($"Image found at: {image.Path}");
}
// Para más información, por favor visita https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
// specify the input Word document information
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// Crear objeto ImagesRequest
var request = new ImagesRequest(options);
// Llama a la API para extraer imágenes del documento de Word.
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image found at: {image.Path}");
}
Descargar imágenes de documentos de Word usando cURL
Si tu preferencia es la extracción de imágenes sin fragmento de código, entonces intenta llamar a GroupDocs.Parser Cloud usando comandos cURL desde la terminal de línea de comandos o archivos por lotes.
Paso 1 – Generar token JWTAccess:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Paso 2 – Extraer Imágenes:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- Reemplace con el que generó.
- Si prefieres extraer las imágenes de todas las páginas, entonces omite los parámetros
StartPageNumber
yCountPagesToExtract
.
Extractor de Imágenes de Documentos de Word Gratis
Si no tienes tu entorno configurado y deseas probar las capacidades de GroupDocs.Parser Cloud API, entonces puedes considerar probar nuestra aplicación gratuita online Word Image Extractor.

Resumen
El SDK de GroupDocs.Parser Cloud para .NET es una solución confiable para la extracción de contenido, el análisis de documentos y los flujos de trabajo de automatización que involucran Word, PDF, Excel y otros formatos. ¡Intenta utilizar nuestra API REST hoy!
Lectura Adicional
Preguntas Frecuentes – FAQs
¿Puedo extraer imágenes de páginas específicas en un documento de Word?
- Sí. Puedes definir los parámetros
StartPageNumber
yCountPagesToExtract
.
¿La API preserva la resolución de las imágenes?
- Sí. La API devuelve imágenes incrustadas con calidad y resolución similares a las que tenían dentro del documento de Word.
¿Es Microsoft Word necesario para realizar esta operación?
- No. Esta es una solución basada en la nube y funciona independientemente de MS Office.
¿Hay una prueba gratuita?
- Sí. Puedes obtener 150 llamadas API gratuitas por mes con una cuenta de prueba. Para más información, por favor visita pricing guide.