Cómo convertir pdf a html sin perder formato

Cómo convertir PDF a HTML mediante programación

PDF(Formato de documento portátil) es un formato de documento seguro que contiene gráficos, texto, modelos 3D, imágenes, etc. El formato PDF está comprimido y es más pequeño que otros formatos de archivo que se pueden compartir. HTML es un lenguaje de marcado ligero de texto sin formato ampliamente utilizado. Es compatible con todos los navegadores y se carga rápidamente. PDF y HTML, ambos formatos de archivo son buenos para la accesibilidad, pero HTML es generalmente mucho mejor para proporcionar información a través de la web. Entonces, en este artículo, demostraremos cómo convertir PDF a HTML en línea en Node.js.

En este artículo se tratarán los siguientes temas:

API REST de conversión de PDF a página HTML y SDK de Node.js

Node.js SDK de GroupDocs.Conversion es una biblioteca de conversión de NodeJS en línea que le permite realizar conversiones de PDF a HTML en línea. Es una biblioteca independiente de la plataforma y una solución de conversión de documentos. Le permite convertir sin problemas sus documentos e imágenes de cualquier formato de archivo compatible a cualquier formato que necesite. Puede convertir fácilmente más de 50 tipos de documentos e imágenes como Word, PowerPoint, Excel, PDF, HTML, CAD, imágenes rasterizadas, etc. También es compatible con .NET, Java, PHP, Ruby, Android y Python SDK como su miembros de la familia de conversión de documentos para la API de Cloud.

GroupDocs.Conversion Cloud se puede instalar con el siguiente comando en la consola de Node.js:

npm install groupdocs-conversion-cloud

Luego, obtenga su ID de cliente y Secreto de cliente del panel de control antes de comenzar a seguir los pasos y los ejemplos de código disponibles. Una vez que tenga su identificación y secreto, agregue el código como se muestra a continuación:

# Importe el SDK de Node.js en su aplicación de nodo desde http://api.groupdocs.cloud
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// obtenga clientId y clientSecret de https://dashboard.groupdocs.cloud (se requiere registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Cómo convertir PDF a formato HTML en Node.js usando REST API

Los pasos que se indican a continuación le permitirán convertir archivos PDF a HTML utilizando Nodejs.

  1. Subir el archivo PDF a la nube
  2. Convertir archivo PDF al formato HTML
  3. Descargar el archivo HTML convertido

Sube el archivo PDF

El siguiente ejemplo de código se puede utilizar para cargar el archivo PDF en la nube:

// abra el archivo en IOStream desde la unidad de su sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// leer archivo
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // crear solicitud de carga de archivo
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // subir archivo
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

El archivo PDF cargado está disponible en la sección de archivos de su tablero.

Convierta un documento PDF a HTML en Node.js

La conversión de PDF a HTML utilizando esta biblioteca de Node.js es cuestión de unas pocas líneas de código fuente. Puede seguir los siguientes pasos y el fragmento de código:

  • Crea una instancia de ConvertApi
  • Cree una instancia de ConvertSettings
  • Establezca el nombre de almacenamiento y la ruta del archivo PDF de entrada
  • A continuación, asigne “html” al formato
  • Ahora, proporcione la ruta del archivo HTML de salida
  • Crear ConvertDocumentRequest con ConvertSettings
  • Finalmente, convierta llamando al método convertDocument() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo convertir PDF a HTML en línea en Nodejs usando la API REST:

// Cómo convertir PDF a formato HTML en Node.js usando REST API
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Crear solicitud de documento de conversión
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Descargar el archivo convertido

El ejemplo de código anterior guardará el archivo HTML convertido en la nube. Ahora sabe cómo convertir PDF a formato HTML usando Node.js. A continuación, descargue el archivo HTML utilizando el siguiente ejemplo de código:

// construir FileApi para descargar el archivo convertido
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// crear solicitud de archivo de descarga
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// descargar archivo y tipo de respuesta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // guardar el archivo en el directorio de su sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Convierta páginas específicas de PDF a HTML en Node.js usando REST API

Puede seguir los siguientes pasos y el fragmento de código para convertir PDF a HTML en su aplicación Node.js con algunas configuraciones avanzadas:

Siga los pasos que se indican a continuación:

  • En primer lugar, cree una instancia de ConvertApi
  • Cree una instancia de ConvertSettings
  • Establezca el nombre de almacenamiento y la ruta del archivo PDF de entrada
  • A continuación, asigne “html” al formato
  • Crear una instancia de la clase HtmlConvertOptions
  • Establezca varias opciones de conversión como fromPage, pagesCount, fixedLayout, etc.
  • Ahora, proporcione las opciones de conversión de salida y la ruta del archivo HTML
  • Crear ConvertDocumentRequest con ConvertSettings
  • Finalmente, convierta llamando al método convertDocument() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo convertir PDF a HTML en Node.js usando opciones avanzadas:

// Cómo convertir páginas específicas de PDF a HTML en Node.js usando la API REST
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Crear solicitud de documento de conversión
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Conversor de PDF a HTML gratuito en línea

¿Cómo cambiar el formato PDF a HTML en línea de forma gratuita? Intente lo siguiente conversor de PDF a HTML en línea gratuito. Este convertidor de PDF a HTML5 en línea se desarrolla utilizando la API anterior y puede convertir rápidamente PDF a tabla HTML en línea.

Conclusión

Los archivos PDF y HTML se utilizan ampliamente para almacenar y transmitir datos. Entonces, este artículo cubrió cómo convertir PDF a formato HTML en aplicaciones Node.js. Ahora ya sabes:

  • cómo convertir PDF a formato HTML en Node.js usando REST API;
  • cómo convertir páginas específicas de PDF a HTML en Node.js usando REST API
  • convertidor en línea gratuito de PDF a HTML en línea;

Además, puede obtener más información sobre GroupDocs.Conversion Cloud API utilizando la documentación o los ejemplos disponibles en GitHub. También proporcionamos una sección Referencia de API donde puede interactuar con las API directamente con su navegador web. Puede echar un vistazo a nuestra Guía para la página de inicio.

Además, Groupdocs.cloud también sigue actualizándose con nuevos temas. Por lo tanto, manténgase al día con la información más actualizada.

Hacer una pregunta

Le invitamos a hacer sus preguntas sobre el convertidor de PDF a HTML Node.js a través de nuestro Foro de soporte gratuito.

preguntas frecuentes

¿Cómo convierto un PDF a HTML en Node.js?

Siga este enlace para aprender el fragmento de código sobre cómo generar PDF desde HTML usando javascript de forma rápida y conveniente.

¿Cómo generar PDF desde HTML Node.js usando REST API?

Cree una instancia de ConvertApi, establezca los valores de la configuración de conversión e invoque el método convertDocument con ConvertDocumentRequest para generar PDF desde un archivo HTML.

¿Cómo convertir PDF a HTML en línea gratis?

Conversor de código PDF a HTML gratuito en línea le permite convertir PDF a formato de archivo HTML, rápida y fácilmente. Una vez completada la conversión, puede descargar el archivo HTML.

¿Cómo convierto un PDF a HTML sin conexión?

Visite este enlace para descargar el software gratuito de conversión de PDF a HTML en Windows. Este software de descarga gratuita de conversión de PDF a HTML en línea se puede utilizar para convertir PDF a HTML en Windows rápidamente, con un solo clic.

Ver también

Te recomendamos leer los siguientes artículos para saber más: