Cómo convertir un archivo PDF a un documento HTML en Java usando la API REST

Convierta PDF a HTML en Java usando REST API

Como desarrollador de Java, puede convertir mediante programación documentos PDF(formato de documento portátil) a páginas web HTML(lenguaje de marcado de hipertexto) mediante la API REST de GroupDocs.Conversion. En ciertos escenarios, es posible que deba convertir un archivo PDF a HTML. Por ejemplo, necesita compartir documentos PDF en redes sociales o publicar contenido PDF en línea en la web. con HTML puedes usar formularios, enlaces y otros elementos interactivos y permite que el documento sea más interactivo. Entonces, en este artículo demostraré cómo convertir PDF a HTML en Java utilizando la API REST.

En este tutorial se tratarán los siguientes temas:

API REST del convertidor de PDF a HTML de Java: instalación del SDK de Java

Para convertir un archivo PDF a formato HTML, usaré el Java SDK de GroupDocs.Conversion Cloud API. Le ayuda a incluir GroupDocs. Servicios de conversión en la nube en sus aplicaciones Java de forma rápida y sencilla. Esta es la mejor API de conversión de PDF a HTML que conserva el formato de texto original y los diseños de sus documentos. Las API de conversión de Groupdocs también le permiten convertir sus archivos e imágenes de cualquier formato de archivo compatible a cualquier formato que necesite. Puede convertir fácilmente entre más de 50 tipos de documentos e imágenes como Word, PDF, PowerPoint, Excel, HTML, CAD, imágenes rasterizadas, etc.

Puede descargar el archivo JAR de la API o instalarlo usando las configuraciones de Maven. Agregue repositorio y dependencia al POM.xml de su proyecto. A continuación se muestran las instrucciones para Maven:

Repositorio Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dependencia Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Obtenga su ID de cliente y secreto de cliente del panel antes de comenzar a seguir los pasos y los ejemplos de código disponibles. Ingrese el código que se muestra a continuación una vez que tenga su identificación y secreto:

# Obtenga su client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Convierta un archivo PDF en un documento HTML en Java mediante la API REST

La conversión de documentos PDF a páginas web HTML le permite hacer que el contenido sea más accesible, buscable, compatible, editable y compartible. Los siguientes son los pasos para convertir un documento PDF a HTML como se menciona a continuación:

Sube el archivo

En primer lugar, cargue el documento PDF en el almacenamiento en la nube utilizando el fragmento de código que se indica a continuación:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Subir archivo al almacenamiento en la nube usando Java
public class App {

	public static void main(String[] args) {
				
		// Crear una instancia de la API de conversión					
		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Como resultado, el archivo PDF cargado estará disponible en la sección de archivos de su tablero en la nube.

Convertir PDF a HTML en Java

Esta sección muestra cómo convertir mediante programación un archivo PDF a una página HTML sin perder el formato siguiendo los pasos a continuación:

  • En primer lugar, cree una instancia de ConvertApi
  • En segundo lugar, cree una instancia de ConvertSettings
  • En tercer lugar, proporcione el nombre de almacenamiento en la nube
  • Establezca la ruta del archivo PDF de entrada y el formato del archivo de salida como “html”
  • Ahora, configure la ruta del archivo HTML de salida
  • Crear ConvertDocumentRequest con ConvertSettings
  • Finalmente, llame al método convertdocument() con ConvertDocumentRequest

El siguiente fragmento de código muestra cómo cambiar un archivo PDF a formato HTML en línea usando la API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Cómo convertir archivos PDF a HTML en Java.
public class App {

	public static void main(String[] args) {
		
		// Crear una instancia de la API de conversión
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Preparar la configuración de conversión
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			settings.setOutputPath("java-testing/output-sample-file.html");
		
			// convertir al formato especificado
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document converted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Descargar el archivo convertido

El ejemplo de código anterior guardará la página del archivo HTML convertido en la nube. Puede descargarlo utilizando el siguiente fragmento de código:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Descargar archivo desde el almacenamiento en la nube en Java
public class App {

	public static void main(String[] args) {
				
		// Crear una instancia de la API de conversión					
		FileApi apiInstance = new FileApi(configuration);
		try {
			DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.html", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.err.println("Expected response type is File: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Así es como funciona la biblioteca de conversión de PDF a HTML en Java. En la siguiente sección, exploremos configuraciones de conversión más avanzadas usando la API de Java.

Convierta PDF a página HTML en Java usando opciones avanzadas

En esta sección, aprenderá cómo convertir un archivo PDF a un documento HTML utilizando algunas opciones avanzadas mediante programación siguiendo los pasos y el fragmento de código que se muestra a continuación:

  • En primer lugar, cree una instancia de la clase ConvertApi
  • Crear una instancia de la clase ConvertSettings
  • A continuación, proporcione el nombre de almacenamiento en la nube
  • Establezca la ruta del archivo PDF de entrada y el formato del archivo de salida como “html”
  • Ahora, cree una instancia de la clase HtmlConvertOptions
  • Establezca varias opciones de conversión como setFromPage, setPagesCount, setFixedLayout, etc.
  • Luego, configure las opciones de conversión y la ruta del archivo de salida
  • A continuación, cree ConvertDocumentRequest con ConvertSettings
  • Finalmente, realice la conversión usando el método convertdocument() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo convertir un archivo PDF a una página HTML utilizando la configuración avanzada.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Java convierte un archivo PDF a una página HTML usando opciones adicionales.
public class App {

	public static void main(String[] args) {
		
		// Crear una instancia de la API de conversión
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Preparar la configuración de conversión
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			HtmlConvertOptions convertOptions = new HtmlConvertOptions();
			convertOptions.setFromPage(1);
			convertOptions.setPagesCount(2);
			convertOptions.setFixedLayout(true);

			settings.setConvertOptions(convertOptions);
			settings.setOutputPath("java-testing/output-sample-file.html");
			
			// convertir al formato especificado
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document conveted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Siga los pasos mencionados anteriormente para cargar y descargar los archivos.

Convertidor de PDF a HTML en línea gratis

¿Cómo convertir un archivo PDF a HTML en línea de forma gratuita? Pruebe el [convertidor] de PDF a HTML en línea (https://products.groupdocs.app/conversion/pdf-to-html) para crear HTML a partir de PDF en línea de forma gratuita. Fue desarrollado utilizando la API anterior para convertir PDF a HTML en línea de forma gratuita.

Conclusión

Esto nos lleva al final de este artículo. En este artículo hemos aprendido:

  • cómo transformar un documento PDF a HTML en Java mediante programación;
  • cómo convertir un archivo PDF a un archivo HTML usando algunas configuraciones avanzadas en Java;
  • cargue mediante programación el archivo PDF en la nube y luego descargue el archivo HTML convertido de la nube;
  • convertir en línea PDF a HTML gratis usando el software de conversión de PDF a HTML;

Además, puede obtener más información sobre la API de conversión de archivos GroupDocs.Conversion utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. El código fuente completo de Java SDK está disponible gratuitamente en Github. Consulte GroupDocs.Conversion Cloud SDK para Java Ejemplos aquí.

Finalmente, groupdocs.cloud está escribiendo nuevos artículos de blog sobre conversiones de diferentes formatos de archivo utilizando la API REST. Por lo tanto, manténgase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Para cualquier consulta/discusión sobre PDF to HTML Converter API, no dude en contactarnos en el [foro] de soporte gratuito 23.

preguntas frecuentes

¿Cómo convierto PDF a HTML en Java?

Siga este enlace para aprender el fragmento de código Java sobre cómo convertir un archivo PDF a una página HTML, rápida y fácilmente.

¿Puedo convertir PDF a HTML en Java usando la API REST?

Sí, puede cambiar PDF a HTML en Java. En primer lugar, cree una instancia de ConvertApi, establezca los valores de la configuración de conversión e invoque el método convertDocument con ConvertDocumentRequest para convertir una página web de PDF a HTML.

¿Cómo convertir PDF a HTML en línea gratis?

Conversor de PDF a HTML en línea gratis le permite convertir PDF a HTML gratis, rápida y fácilmente. Una vez que se completa la conversión en línea de PDF a HTML, puede descargar instantáneamente el archivo HTML convertido en su PC.

¿Cómo convierto en línea PDF a HTML?

  • Abrir conversor gratuito de PDF a HTML en línea
  • Haga clic dentro del área de colocación de archivos para cargar un archivo PDF o arrastre y suelte un archivo PDF.
  • Haga clic en el botón Convertir ahora, el convertidor gratuito de PDF a HTML en línea cambiará el archivo PDF a HTML en línea de forma gratuita.
  • El enlace de descarga del archivo HTML de salida estará disponible instantáneamente después de convertir el archivo PDF a un documento HTML de forma gratuita.

¿Cómo instalar la biblioteca Java de PDF a HTML?

Puede descargar e instalar biblioteca de conversión de PDF a HTML de Java para procesar, manipular y crear HTML a partir de PDF en Java mediante programación.

¿Cómo convertir PDF a HTML en Windows?

Visite este enlace para descargar el convertidor de PDF a HTML sin conexión para Windows. Este software de descarga gratuita de conversión de PDF a HTML se puede utilizar para exportar PDF a HTML en Windows rápidamente, con un solo clic.

Ver también

Te recomendamos visitar los siguientes artículos para conocer: