Cómo extraer páginas de un documento de Word en línea usando Node.js

Cómo extraer páginas de Word DOC/DOCX en línea usando Node.js

Es posible que deba extraer palabra páginas de documentos en varios documentos mediante programación. Al dividir documentos de Word, puede extraer fácilmente una página de un documento de Word y compartir información o datos específicos con las partes interesadas. Como desarrollador de Node.js, puede extraer documentos de Word en archivos separados en línea en la nube. En este artículo, aprenderá cómo extraer páginas de Word DOC/DOCX en línea usando Node.js.

En este artículo se tratarán los siguientes temas:

API REST de Word Page Extractor Online y SDK de Node.js

Para extraer páginas de un documento de Word, utilizaré la API Node.js SDK of GroupDocs.Merger Cloud. Es una biblioteca de descarga gratuita del extractor de páginas de Word en línea. Le permite dividir, combinar, extraer, eliminar y reorganizar una sola página o una colección de páginas de formatos de documentos compatibles de Word, Excel, PowerPoint, dibujos de Visio, PDF y HTML.

Puede instalar la nube GroupDocs.Merger para extraer páginas de Word de su aplicación Node.js usando el siguiente comando en la consola:

npm install groupdocs-merger-cloud

Por favor, obtenga su ID de cliente y secreto del tablero antes de seguir los pasos mencionados. Una vez que tenga su ID y secreto, agregue el código como se muestra a continuación:

# Importe el SDK de Node.js en su aplicación de nodo desde http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// obtenga clientId y clientSecret de https://dashboard.groupdocs.cloud (se requiere registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extraer páginas de Word en un nuevo documento por números de página exactos

Puede exportar páginas específicas desde un archivo de Word mediante programación en la nube siguiendo los sencillos pasos que se mencionan a continuación:

  • Subir el archivo de Word a la Nube
  • Extracto Páginas de Word usando REST API en Node.js
  • Descargar los archivos separados

Sube el archivo de Word

En primer lugar, cargue el archivo de Word en la nube usando el ejemplo de código que se muestra a continuación:

// abra el archivo en IOStream desde la unidad de su sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// leer archivo
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // crear solicitud de carga de archivo
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
  // subir archivo
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Como resultado, el archivo de Word cargado estará disponible en la sección de archivos de su tablero en la nube.

Extraiga páginas de Word usando la API REST en Node.js

Puede extraer fácilmente páginas de un archivo de Word mediante programación siguiendo los pasos que se detallan a continuación:

  • En primer lugar, cree una instancia de PagesApi.
  • Cree una instancia de ExtractOptions.
  • Cree una instancia de FileInfo.
  • Luego, establezca la ruta al archivo de Word de entrada.
  • A continuación, establezca la ruta al archivo de Word extraído.
  • Establezca números de página específicos en una matriz separada por comas para extraer el archivo de Word.
  • Cree una solicitud de extracción con opciones de extracción.
  • Finalmente, llame al método pagesApi.extract() con ExtractRequest para obtener resultados.

El siguiente fragmento de código muestra cómo extraer páginas de Word en archivos separados usando la API REST en Node.js:

// Cómo extraer páginas de Word en un nuevo documento por números de página exactos
const extractwordpages = async () => {

  // inicialización de la API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opciones de extracción
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.pages = [2, 4, 7];
  
  try {
    // crear solicitud de extracción
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extraer páginas del archivo docx
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractwordpages()
.then(() => {
  console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file:", err);
})

Descargar los archivos extraídos

El ejemplo de código anterior guardará los archivos separados en la nube. Puede descargarlos utilizando el siguiente ejemplo de código:

// construir FileApi para descargar el archivo combinado
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// crear solicitud de archivo de descarga
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// descargar archivo y tipo de respuesta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // guardar el archivo en el directorio de su sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extraiga páginas de documentos de Word por rango de páginas usando la API REST en Node.js

Puede extraer y guardar páginas de una palabra por separado proporcionando un rango de números de página mediante programación siguiendo los pasos que se detallan a continuación:

  • En primer lugar, cree una instancia de PagesApi.
  • Cree una instancia de ExtractOptions.
  • Cree una instancia de FileInfo.
  • Luego, establezca la ruta al archivo de Word de entrada.
  • A continuación, establezca la ruta al archivo de Word extraído.
  • Establezca los valores startPageNumber y endPageNumber.
  • Luego, configure rangeMode como EvenPages o OddPages
  • Cree una solicitud de extracción con opciones de extracción.
  • Finalmente, llama al método pagesApi.extract() con ExtractRequest para obtener resultados.

El siguiente fragmento de código muestra cómo extraer páginas de Word en línea usando el rango de páginas y el modo de página en Node.js:

// Cómo extraer páginas de documentos de Word por rango de páginas usando la API REST en Node.js
const extractpages = async () => {

  // inicialización de la API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opciones de extracción
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // crear solicitud de extracción
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extraer páginas de archivos de Word
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file.", err);
})

De manera similar, puede extraer páginas impares de documentos de Word.

Prueba en línea

¿Cómo extraer páginas de un documento de Word en línea? Pruebe la siguiente herramienta gratuita de extracción de Word en línea para extraer páginas de Word en línea de forma gratuita. Esta herramienta en línea gratuita de extractor de páginas de Word se desarrolla utilizando la API anterior.

Conclusión

En este artículo, has aprendido:

  • cómo extraer ciertas páginas de un documento de Word en línea usando la API REST;
  • cómo extraer páginas de un documento de Word utilizando el rango de páginas y el filtro de modo de rango;
  • cargue el archivo de Word en la nube para exportar las páginas seleccionadas de Word en línea;
  • descargar y guardar ciertas páginas de Word desde la nube;
  • cómo extraer páginas de Word gratis;

Ahora, sabe cómo extraer todas las páginas de un documento de Word o cómo guardar ciertas páginas de Word. La API también le permite reordenar o reemplazar páginas de documentos, cambiar la orientación de la página, administrar contraseñas de documentos y realizar otras manipulaciones fácilmente para cualquier formato de archivo compatible. Además, puede obtener más información sobre GroupDocs.Merge Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar e interactuar con nuestras API directamente a través del navegador.

Hacer una pregunta

Puede hacer sus consultas sobre el extractor de páginas de Word para exportar páginas seleccionadas de Word, a través de nuestro Foro de soporte gratuito

preguntas frecuentes

¿Cómo extraer varias páginas de Word en un solo archivo?

Instale biblioteca JS para separar archivos de Word en varias páginas en línea mediante programación. Puede visitar la documentación para obtener detalles completos de la API.

¿Cuánto tiempo lleva extraer páginas específicas de Word?

Biblioteca HTML a Word de JavaScript funciona muy rápido y puede extraer páginas de Word protegido fácilmente en unos pocos segundos.

Ver también