convertidor de pdf a html

Desarrollar un convertidor de PDF a HTML con API REST en Java.

Convertir PDF documentos a HTML formato es esencial para el desarrollo web, la gestión de contenido y la mejora de la accesibilidad. Ya sea que necesite mostrar documentos en línea o reutilizar contenido para aplicaciones basadas en la web, convertir PDF a HTML mediante Java REST API proporciona una solución simple y eficiente. En este artículo, exploraremos el proceso paso a paso de transformar archivos PDF en formato HTML utilizando GroupDocs.Conversion Cloud SDK para Java.

Este artículo cubre los siguientes temas:

API REST para conversión de PDF a HTML

GroupDocs.Conversion Cloud SDK for Java ofrece una solución robusta y flexible para convertir documentos PDF a formato HTML con alta precisión. La API preserva la estructura del documento, imágenes y formato, mientras permite la personalización del rango de páginas, estructura de salida y calidad de imagen.

Instalación

Para instalar GroupDocs.Conversion Cloud SDK para Java, agrega la siguiente dependencia de Maven:

<repository>
    <id>repository.groupdocs.cloud</id>
    <name>repository.groupdocs.cloud</name>
    <url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>24.2.0</version>
</dependency>

Asegúrate de tener credenciales de API válidas (ID de cliente y secreto de cliente).Sigue este tutorial para obtenerlas.

Convertir PDF a HTML usando Java

Sigue estos pasos para automatizar la conversión de PDF a HTML en Java:

  1. Inicializar Configuration con credenciales de API:
Configuration configuration = new Configuration(clientId, clientSecret);
  1. Crear una instancia de ConvertApi:
ConvertApi convertApi = new ConvertApi(configuration);
  1. Sube el archivo PDF de entrada al almacenamiento en la nube:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
  1. Crea una instancia de la clase ConvertSettings donde definimos el nombre del PDF de entrada, el formato de salida como html y el nombre del archivo resultante:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
  1. Realiza la conversión de PDF a PPT utilizando la clase ConvertDocumentRequest donde pasamos el objeto ConvertSettings como argumento:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// More examples over https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Obtenga sus credenciales de API 
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";

// Cree una instancia de la clase Configuration e inicialícela con el Client ID y Client Secret.
Configuration configuration = new Configuration(clientId, clientSecret);
// Definir la URL base de la API para la operación de conversión de archivos PDF a HTML
configuration.setApiBaseUrl("https://api.groupdocs.cloud");

// Inicializa una instancia de ConvertApi con el objeto Configuration.
ConvertApi convertApi = new ConvertApi(configuration);

ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
    
// Invoca la API ConvertDocument para la conversión de PDF a HTML.
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
    
// Check the response and print success message
if (response != null && response.equals("OK")) {
    System.out.println("The PDF to HTML file conversion completed successfully!");
}
free pdf to html online

Imagen:- Una vista previa de la conversión de PDF a HTML.

Descargue el archivo PDF de muestra utilizado en el ejemplo anterior desde input.pdf.

Convertir PDF a Página Web usando comandos cURL

Para los usuarios de la línea de comandos, GroupDocs.Conversion Cloud la API permite la conversión de PDF a HTML a través de comandos cURL, haciendo que la automatización sea perfecta.

  • Generar Token de Acceso JWT con tus credenciales.
  • Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{finalOutput}\"}"

Reemplace sourceFile, resultantFile y accessToken con valores reales.

  • Si tienes la necesidad de guardar el archivo HTML resultante en el disco local, entonces por favor ejecuta el siguiente comando cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "myFinaloutput.html"

Prueba nuestro conversor de PDF a HTML gratuito

Usa nuestro PDF to HTML Converter para una experiencia de conversión en línea rápida y eficiente.

Conversor de PDF a PPT gratuito en línea

Enlaces Útiles

Conclusión

Ya sea utilizando el SDK de GroupDocs.Conversion Cloud para Java o comandos cURL, ambos enfoques ofrecen una forma rápida, precisa y flexible de convertir PDF a HTML. Con procesamiento basado en la nube, alta personalización y una API amigable para desarrolladores, GroupDocs.Conversion Cloud simplifica la conversión de documentos. ¡Prueba nuestro SDK de Java hoy para una automatización fluida de PDF a HTML!

Artículos Recomendados

Recomendamos encarecidamente explorar los siguientes artículos: