Como extrair páginas de um documento do Word online usando Node.js

Como extrair páginas do Word DOC/DOCX online usando Node.js

Pode ser necessário extrair as páginas do documento word em vários documentos programaticamente. Ao dividir documentos do Word, você pode extrair facilmente a página do documento do Word e compartilhar informações ou dados específicos com as partes interessadas. Como desenvolvedor Node.js, você pode extrair documentos do Word em arquivos separados online na nuvem. Neste artigo, você aprenderá como extrair páginas do Word DOC/DOCX online usando Node.js.

Os seguintes tópicos serão abordados neste artigo:

API REST online do Word Page Extractor e SDK Node.js

Para extrair páginas do documento do Word, usarei a API Node.js SDK of GroupDocs.Merger Cloud. É uma biblioteca de download gratuito do extrator de páginas do Word on-line. Ele permite que você divida, combine, extraia, remova e reorganize uma única página ou uma coleção de páginas de formatos de documento suportados de Word, Excel, PowerPoint, Desenhos do Visio, PDF e HTML.

Você pode instalar a nuvem GroupDocs.Merger para extrair páginas do Word de seu aplicativo Node.js usando o seguinte comando no console:

npm install groupdocs-merger-cloud

Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:

# Importe o SDK do Node.js em seu aplicativo de nó de http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// obtenha clientId e clientSecret em https://dashboard.groupdocs.cloud (é necessário registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extraia páginas do Word para um novo documento por números de página exatos

Você pode exportar páginas específicas do arquivo do Word programaticamente na nuvem seguindo as etapas simples mencionadas abaixo:

  • Carregar o arquivo do Word para a nuvem
  • Extract Páginas do Word usando API REST em Node.js
  • Baixar os arquivos separados

Carregue o arquivo do Word

Em primeiro lugar, carregue o arquivo do Word para a nuvem usando o exemplo de código abaixo:

// abra o arquivo no IOStream da unidade do sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// ler arquivo
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // criar solicitação de upload de arquivo
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
  // subir arquivo
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Como resultado, o arquivo do Word carregado estará disponível na seção de arquivos do seu painel na nuvem.

Extraia páginas do Word usando a API REST em Node.js

Você pode facilmente extrair páginas do arquivo do Word programaticamente seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância de PagesApi.
  • Crie uma instância de ExtractOptions.
  • Crie uma instância do FileInfo.
  • Em seguida, defina o caminho para o arquivo do Word de entrada.
  • Em seguida, defina o caminho para o arquivo do Word extraído.
  • Defina números de página específicos em uma matriz separada por vírgulas para extrair o arquivo do Word.
  • Crie ExtractRequest com ExtractOptions.
  • Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.

O trecho de código a seguir mostra como extrair páginas do Word em arquivos separados usando a API REST no Node.js:

// Como extrair páginas do Word para um novo documento por números de página exatos
const extractwordpages = async () => {

  // inicialização da API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opções de extração
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.pages = [2, 4, 7];
  
  try {
    // criar solicitação de extração
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extrair páginas do arquivo docx
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractwordpages()
.then(() => {
  console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file:", err);
})

Baixe os arquivos extraídos

O exemplo de código acima salvará os arquivos separados na nuvem. Você pode baixá-los usando o seguinte exemplo de código:

// construir FileApi para baixar o arquivo mesclado
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// criar solicitação de download de arquivo
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// arquivo de download e tipo de resposta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // salve o arquivo no diretório do sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extrair páginas de documentos do Word por intervalo de páginas usando a API REST em Node.js

Você pode extrair e salvar páginas de um Word separadamente, fornecendo um intervalo de números de página programaticamente seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância de PagesApi.
  • Crie uma instância de ExtractOptions.
  • Crie uma instância do FileInfo.
  • Em seguida, defina o caminho para o arquivo do Word de entrada.
  • Em seguida, defina o caminho para o arquivo do Word extraído.
  • Defina os valores startPageNumber e endPageNumber.
  • Em seguida, defina o rangeMode como EvenPages ou OddPages
  • Crie ExtractRequest com ExtractOptions.
  • Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.

O trecho de código a seguir mostra como extrair páginas do Word online usando o intervalo de páginas e o modo de página no Node.js:

// Como extrair páginas de documentos do Word por intervalo de páginas usando a API REST no Node.js
const extractpages = async () => {

  // inicialização da API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definir opções de extração
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // criar solicitação de extração
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extrair páginas de arquivos do Word
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file.", err);
})

Da mesma forma, você pode extrair páginas ímpares de documentos do Word.

Experimente on-line

Como extrair páginas de um documento do Word online? Tente a seguinte ferramenta online gratuita de extração do Word para extrair páginas do Word online gratuitamente. Esta ferramenta on-line gratuita do extrator de páginas do Word foi desenvolvida usando a API acima.

Conclusão

Neste artigo, você aprendeu:

  • como extrair certas páginas do documento do Word online usando a API REST;
  • como extrair páginas do documento do Word usando intervalo de páginas e filtro de modo de intervalo;
  • carregue o arquivo do Word para a nuvem para exportar as páginas selecionadas do Word online;
  • baixe e salve certas páginas do Word da nuvem;
  • como extrair páginas do Word grátis;

Agora você sabe como extrair todas as páginas de um documento do Word ou como salvar algumas páginas de um documento do Word. A API também permite que você reordene ou substitua páginas de documentos, altere a orientação da página, gerencie senhas de documentos e execute outras manipulações facilmente para qualquer formato de arquivo compatível. Além disso, você pode aprender mais sobre GroupDocs.Merge Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador.

Faça uma pergunta

Você pode fazer suas perguntas sobre o extrator de páginas do Word para exportar páginas selecionadas do Word, através do nosso Fórum de suporte gratuito

perguntas frequentes

Como extrair várias páginas do Word em um arquivo?

Instale a biblioteca JS para separar arquivos do Word em várias páginas online de forma programática. Você pode visitar a documentação para obter detalhes completos da API.

Quanto tempo leva para extrair páginas específicas do Word?

Biblioteca JavaScript HTML para Word funciona muito rápido e você pode extrair páginas do Word protegido facilmente em alguns segundos.

Veja também