
Desarrollar un convertidor de PDF a HTML con API REST en Java.
Convertir PDF documentos a HTML formato es esencial para el desarrollo web, la gestión de contenido y la mejora de la accesibilidad. Ya sea que necesite mostrar documentos en línea o reutilizar contenido para aplicaciones basadas en la web, convertir PDF a HTML mediante Java REST API proporciona una solución simple y eficiente. En este artículo, exploraremos el proceso paso a paso de transformar archivos PDF en formato HTML utilizando GroupDocs.Conversion Cloud SDK para Java.
Este artículo cubre los siguientes temas:
- API REST para la conversión de PDF a HTML
- Convertir PDF a HTML usando Java
- Convertir PDF a Página Web usando comandos cURL
API REST para conversión de PDF a HTML
GroupDocs.Conversion Cloud SDK for Java ofrece una solución robusta y flexible para convertir documentos PDF a formato HTML con alta precisión. La API preserva la estructura del documento, imágenes y formato, mientras permite la personalización del rango de páginas, estructura de salida y calidad de imagen.
Instalación
Para instalar GroupDocs.Conversion Cloud SDK para Java, agrega la siguiente dependencia de Maven:
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>24.2.0</version>
</dependency>
Asegúrate de tener credenciales de API válidas (ID de cliente y secreto de cliente).Sigue este tutorial para obtenerlas.
Convertir PDF a HTML usando Java
Sigue estos pasos para automatizar la conversión de PDF a HTML en Java:
- Inicializar
Configuration
con credenciales de API:
Configuration configuration = new Configuration(clientId, clientSecret);
- Crear una instancia de
ConvertApi
:
ConvertApi convertApi = new ConvertApi(configuration);
- Sube el archivo PDF de entrada al almacenamiento en la nube:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
- Crea una instancia de la clase
ConvertSettings
donde definimos el nombre del PDF de entrada, el formato de salida comohtml
y el nombre del archivo resultante:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
- Realiza la conversión de PDF a PPT utilizando la clase
ConvertDocumentRequest
donde pasamos el objetoConvertSettings
como argumento:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// More examples over https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Obtenga sus credenciales de API
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";
// Cree una instancia de la clase Configuration e inicialícela con el Client ID y Client Secret.
Configuration configuration = new Configuration(clientId, clientSecret);
// Definir la URL base de la API para la operación de conversión de archivos PDF a HTML
configuration.setApiBaseUrl("https://api.groupdocs.cloud");
// Inicializa una instancia de ConvertApi con el objeto Configuration.
ConvertApi convertApi = new ConvertApi(configuration);
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
// Invoca la API ConvertDocument para la conversión de PDF a HTML.
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
// Check the response and print success message
if (response != null && response.equals("OK")) {
System.out.println("The PDF to HTML file conversion completed successfully!");
}
Imagen:- Una vista previa de la conversión de PDF a HTML.
Descargue el archivo PDF de muestra utilizado en el ejemplo anterior desde input.pdf.
Convertir PDF a Página Web usando comandos cURL
Para los usuarios de la línea de comandos, GroupDocs.Conversion Cloud la API permite la conversión de PDF a HTML a través de comandos cURL, haciendo que la automatización sea perfecta.
- Generar Token de Acceso JWT con tus credenciales.
- Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourcePDF}\", \"Format\": \"html\", \"OutputPath\": \"{finalOutput}\"}"
Reemplace sourceFile, resultantFile y accessToken con valores reales.
- Si tienes la necesidad de guardar el archivo HTML resultante en el disco local, entonces por favor ejecuta el siguiente comando cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourceFile}\", \"Format\": \"html\"}" \
-o "myFinaloutput.html"
Prueba nuestro conversor de PDF a HTML gratuito
Usa nuestro PDF to HTML Converter para una experiencia de conversión en línea rápida y eficiente.
Enlaces Útiles
Conclusión
Ya sea utilizando el SDK de GroupDocs.Conversion Cloud para Java o comandos cURL, ambos enfoques ofrecen una forma rápida, precisa y flexible de convertir PDF a HTML. Con procesamiento basado en la nube, alta personalización y una API amigable para desarrolladores, GroupDocs.Conversion Cloud simplifica la conversión de documentos. ¡Prueba nuestro SDK de Java hoy para una automatización fluida de PDF a HTML!
Artículos Recomendados
Recomendamos encarecidamente explorar los siguientes artículos: