PDF(Portable Document Format) es un formato de archivo ampliamente utilizado para compartir y conservar documentos en línea. A menudo contiene varios tipos de contenido, incluidos texto, imágenes, tablas y más. Extraer contenido específico de archivos PDF, como imágenes, puede ser una tarea desafiante sin herramientas confiables o una biblioteca. Una de estas herramientas es GroupDocs.Parser Cloud SDK para Java, que proporciona una forma eficaz y sin inconvenientes de extraer imágenes de archivos PDF. En este artículo, demostraremos cómo extraer imágenes de archivos PDF en Java utilizando la API REST.
En este artículo se tratarán los siguientes temas:
- API REST de Java para separar imágenes de la instalación de PDF y SDK
- Cómo extraer todas las imágenes de archivos PDF en Java usando REST API
- Extraer imágenes específicas de archivos PDF en Java usando el número de página
API REST de Java para separar imágenes de la instalación de PDF y SDK
GroupDocs.Parser Cloud SDK para Java es una biblioteca de Java poderosa y versátil que proporciona una manera simple y eficiente de analizar y extraer datos de varios formatos de documentos, incluidos los archivos PDF. Ofrece una amplia gama de funciones para el análisis de documentos, lo que permite a los desarrolladores extraer imágenes, texto, metadatos y otro contenido. GroupDocs.Parser también proporciona los SDK de C#.NET, Java, PHP, Ruby y Python como sus miembros de la familia de analizadores de documentos para las API de la nube.
Para comenzar, debe incluir GroupDocs.Parser Cloud SDK en su proyecto Java. Puede descargar el archivo JAR de la API o instalarlo usando Maven agregando el siguiente repositorio y dependencia en el archivo pom.xml de su proyecto:
Repositorio Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dependencia Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
A continuación, debe registrarse para obtener una cuenta de prueba gratuita o comprar un plan de suscripción en el sitio web de GroupDocs y obtener su clave API. Una vez que tenga la identificación del cliente y el secreto del cliente, agregue el siguiente fragmento de código a una aplicación basada en Java:
# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Cómo extraer todas las imágenes de archivos PDF en Java mediante la API REST
Ahora, escribamos los pasos y un fragmento de código de ejemplo para extraer imágenes de archivos PDF usando GroupDocs.Parser Cloud SDK para Java:
- En primer lugar, importe las clases requeridas en su archivo Java.
- En segundo lugar, cree una instancia de la clase ParseApi.
- En tercer lugar, cree una instancia de la clase FileInfo.
- A continuación, establezca la ruta al documento PDF de entrada.
- Luego, crea una instancia de la clase ImagesOptions().
- A continuación, asigne fileInfo a la opción de imagen setFileInfo.
- Ahora, cree una instancia de la clase ImagesRequest() y pase el parámetro ImagesOptions.
- Por último, obtenga resultados llamando al método ParseApi.images() y pasando el parámetro ImagesRequest.
El siguiente ejemplo de código muestra cómo extraer todas las imágenes de un archivo PDF en línea en Java usando la API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Cómo extraer imágenes de un archivo PDF en Java.
public class App {
public static void main(String[] args) {
// Crear una instancia de la API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Preparar los ajustes
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Obtener la ruta del archivo de salida
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extraer imágenes específicas de archivos PDF en Java usando el número de página
En esta sección, proporcionaremos pasos y un fragmento de código para extraer imágenes específicas de un archivo PDF mediante programación en Java:
- En primer lugar, importe las clases requeridas en su archivo Java.
- En segundo lugar, cree una instancia de la clase ParseApi.
- En tercer lugar, cree una instancia de la clase FileInfo.
- A continuación, establezca la ruta al documento PDF de entrada.
- Luego, crea una instancia de la clase ImagesOptions().
- A continuación, asigne fileInfo a la opción de imagen setFileInfo.
- Luego, proporcione los valores setStartPageNumber y setCountPagesToExtract.
- Ahora, cree una instancia de la clase ImagesRequest() y pase el parámetro ImagesOptions.
- Por último, obtenga resultados llamando al método ParseApi.images() y pasando el parámetro ImagesRequest.
El siguiente ejemplo de código muestra cómo extraer imágenes específicas de un archivo PDF por rango de página en Java usando la API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Extraiga imágenes de un archivo PDF en línea por rango de páginas en Java.
public class App {
public static void main(String[] args) {
// Crear una instancia de la API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Preparar los ajustes
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Obtener la ruta del archivo de salida
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extractor de imágenes en línea gratis
¿Cuál es la mejor manera de extraer imágenes de PDF en línea de forma gratuita? Pruebe un analizador de archivos PDF en línea para extraer imágenes de archivos PDF. Este software PDF Parser se desarrolla utilizando la biblioteca de análisis de Java, como se mencionó anteriormente.
Conclusión
En conclusión, GroupDocs.Parser Cloud SDK para Java brinda una solución confiable y eficiente para extraer imágenes de archivos PDF con facilidad. Lo siguiente es lo que has aprendido de este artículo:
- cómo extraer todas las imágenes de archivos PDF mediante programación en Java utilizando REST API;
- cómo extraer imágenes específicas de documentos PDF en Java usando REST API;
- y herramienta de extracción de imágenes en línea para extraer imágenes de documentos PDF.
Además, puede obtener más información sobre GroupDocs.Parser Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar e interactuar con nuestras API directamente a través del navegador. El código fuente completo de Java SDK está disponible gratuitamente en Github.
Finalmente, seguimos escribiendo nuevos artículos de blog en diferentes formatos de archivo y analizándolos usando REST API. Por lo tanto, póngase en contacto para obtener las últimas actualizaciones.
Hacer una pregunta
En caso de que tenga alguna consulta sobre cómo analizar documentos, no dude en contactarnos a través de nuestro foro.
preguntas frecuentes
¿Cómo analizo archivos PDF usando Java?
Para extraer imágenes, texto o metadatos, primero debe cargar y analizar el documento PDF mediante GroupDocs.Parser Cloud SDK. Este proceso implica especificar la ruta del archivo y llamar al método Parse para analizar archivos PDF.
¿Admite GroupDocs.Parser Cloud SDK para Java otros formatos de archivo además de PDF?
Sí, además de los archivos PDF, GroupDocs.Parser Cloud SDK for Java admite la extracción de imágenes de varios formatos de documentos, incluidos Word, Excel, PowerPoint, HTML y muchos más.
¿Puedo extraer todas las imágenes de un archivo PDF con GroupDocs.Parser Cloud SDK para Java?
Sí, puede extraer todas las imágenes de un archivo PDF utilizando GroupDocs.Parser Cloud SDK for Java.
Ver también
Aquí hay algunos artículos relacionados que pueden resultarle útiles:
- Extraiga imágenes de documentos de Word usando Java
- Análisis de documentos: extraiga texto de un archivo PDF en Java
- Extraiga datos de PDF usando REST API en Node.js
- Analizar documentos de Word usando REST API en Python
- Extraiga datos específicos de PDF usando Python
- Extraiga imágenes de documentos PDF usando Python