Cómo extraer páginas de un archivo PDF usando Rest API en Node.js

Cómo extraer páginas de archivos PDF usando Rest API en Node.js

Es posible que deba extraer varias páginas de PDF a la vez mediante programación. Al separar las páginas PDF, puede exportar y guardar fácilmente páginas específicas de documentos PDF para compartir con las partes interesadas. Como desarrollador de Node.js, puede extraer varias páginas de documentos PDF en la nube. En este artículo, demostraremos cómo extraer páginas de un archivo PDF utilizando Rest API en Node.js.

Los siguientes temas se tratarán en este artículo para sacar páginas de PDF:

API REST de PDF Extractor y SDK de Node.js

Para extraer páginas de PDF Adobe Acrobat, usaré la API Node.js SDK de GroupDocs.Merger Cloud. Es una biblioteca de descarga gratuita de extractor de páginas PDF en línea. Le permite dividir, combinar, extraer, eliminar y reorganizar una sola página o una colección de páginas de formatos de documentos admitidos de Word, Excel, PowerPoint, dibujos de Visio, PDF y HTML.

Puede instalar la nube GroupDocs.Merger para extraer páginas PDF de archivos PDF en su aplicación Node.js usando el siguiente comando en la consola:

npm install groupdocs-merger-cloud

Por favor, obtenga su ID de cliente y secreto del tablero antes de seguir los pasos mencionados. Una vez que tenga su ID y secreto, agregue el código como se muestra a continuación:

# Importe el SDK de Node.js en su aplicación de nodo desde http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// obtenga clientId y clientSecret de https://dashboard.groupdocs.cloud (se requiere registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extraiga páginas PDF por números de página exactos utilizando la API REST en Node.js

Puede exportar una sola página desde PDF o exportar páginas específicas desde archivos PDF mediante programación en la nube siguiendo los sencillos pasos que se mencionan a continuación:

  • Subir el archivo PDF a la Nube
  • Extracto páginas PDF usando REST API en Node.js
  • Descargar los archivos separados

Sube el archivo PDF

Puede comenzar importando el archivo PDF a la nube utilizando el ejemplo de código que se muestra a continuación:

// abra el archivo en IOStream desde la unidad de su sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// leer archivo
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // crear solicitud de carga de archivo
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // subir archivo
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

El archivo PDF estará disponible cuando el archivo se cargue en la sección de archivos de su tablero en la nube.

Extraiga páginas PDF utilizando la API REST en Node.js

Los pasos a continuación le enseñarán cómo extraer páginas de un archivo PDF mediante programación:

  • En primer lugar, cree una instancia de PagesApi.
  • Cree una instancia de ExtractOptions.
  • Cree una instancia de FileInfo.
  • Luego, establezca la ruta al archivo PDF de entrada.
  • A continuación, establezca la ruta al archivo PDF extraído.
  • Establezca números de página específicos en una matriz separada por comas para extraer archivos PDF.
  • Cree una solicitud de extracción con opciones de extracción.
  • Finalmente, llama al método pagesApi.extract() con ExtractRequest para obtener resultados.

El siguiente fragmento de código muestra cómo extraer páginas PDF en archivos separados usando la API REST en Node.js:

// Cómo extraer páginas PDF por números de página exactos usando REST API en Node.js
const extractpdfpages = async () => {

  // inicialización de la API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opciones de extracción
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // crear solicitud de extracción
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extraer paginas de documento pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Descargar los archivos extraídos

El ejemplo de código anterior guardará los archivos separados en la nube. Puede descargarlos utilizando el siguiente ejemplo de código:

// construir FileApi para descargar el archivo combinado
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// crear solicitud de archivo de descarga
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// descargar archivo y tipo de respuesta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // guardar el archivo en el directorio de su sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extraiga páginas de PDF por rango de páginas utilizando la API REST en Node.js

Puede extraer y guardar páginas de un PDF por separado proporcionando un rango de números de página mediante programación siguiendo los pasos que se indican a continuación:

  • En primer lugar, cree una instancia de PagesApi.
  • Cree una instancia de ExtractOptions.
  • Cree una instancia de FileInfo.
  • Luego, establezca la ruta al archivo PDF de entrada.
  • A continuación, establezca la ruta al archivo PDF extraído.
  • Establezca el número de la página de inicio y los valores del número de la página final.
  • Luego, configure rangeMode como EvenPages o OddPages
  • Cree una solicitud de extracción con opciones de extracción.
  • Finalmente, llame al método pagesApi.extract() con ExtractRequest para obtener resultados.

El siguiente fragmento de código muestra cómo extraer páginas de PDF en línea usando el rango de páginas y el modo de página en Node.js:

// Cómo extraer páginas de PDF por rango de páginas usando la API REST en Node.js
const extractpages = async () => {

  // inicialización de la API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opciones de extracción
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // crear solicitud de extracción
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extraer páginas de archivos PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

De manera similar, puede extraer páginas impares de documentos PDF.

Prueba en línea

¿Cómo extraer páginas de archivos PDF en línea? Pruebe la siguiente herramienta gratuita de extracción de PDF en línea para extraer páginas de PDF en línea de forma gratuita. Esta herramienta en línea gratuita de extractor de páginas PDF se desarrolla utilizando la API anterior.

Conclusión

Estamos terminando esta publicación de blog aquí. En este artículo, has aprendido:

  • cómo extraer ciertas páginas de PDF o extraer una página de PDF en línea usando REST API;
  • cómo extraer páginas de documentos PDF utilizando el rango de páginas y el filtro de modo de rango;
  • cargue el archivo PDF a la nube para exportar páginas seleccionadas de PDF en línea;
  • descargar y guardar ciertas páginas de PDF desde la nube;
  • cómo extraer páginas de PDF gratis;

Ahora sabe cómo extraer una página de un documento PDF o cómo guardar ciertas páginas de un PDF. La API también le permite reordenar o reemplazar páginas de documentos, cambiar la orientación de la página, administrar contraseñas de documentos y realizar otras manipulaciones fácilmente para cualquier formato de archivo compatible. Además, puede obtener más información sobre GroupDocs.Merge Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar e interactuar con nuestras API directamente a través del navegador.

Además, le recomendamos que consulte nuestra Guía de introducción

Además, groupdocs.cloud escribe regularmente artículos sobre nuevos temas. Por lo tanto, manténgase en contacto para conocer las últimas actualizaciones.

Hacer una pregunta

Puede hacer sus consultas sobre cómo extraer archivos PDF para exportar páginas seleccionadas de PDF, a través de nuestro Foro de soporte gratuito

preguntas frecuentes

¿Cómo extraer varias páginas de PDF en un solo archivo?

Instale biblioteca JS para separar archivos PDF en varias páginas en línea mediante programación. Puede visitar la documentación para obtener detalles completos de la API.

¿Cuánto tiempo se tarda en extraer páginas específicas de un PDF?

Biblioteca HTML a PDF de JavaScript funciona muy rápido y puede extraer fácilmente páginas de PDF protegidos en unos pocos segundos.

Ver también

Para obtener la mejor lectura e información, visite los siguientes artículos: