Pode ser necessário extrair as páginas do documento word em vários documentos programaticamente. Ao dividir documentos do Word, você pode extrair facilmente a página do documento do Word e compartilhar informações ou dados específicos com as partes interessadas. Como desenvolvedor Node.js, você pode extrair documentos do Word em arquivos separados online na nuvem. Neste artigo, você aprenderá como extrair páginas do Word DOC/DOCX online usando Node.js.
Os seguintes tópicos serão abordados neste artigo:
- API REST online do Word Page Extractor e SDK Node.js
- Extraia páginas do Word para um novo documento por números de página exatos
- Extrair páginas de documentos do Word por intervalo de páginas usando a API REST em Node.js
API REST online do Word Page Extractor e SDK Node.js
Para extrair páginas do documento do Word, usarei a API Node.js SDK of GroupDocs.Merger Cloud. É uma biblioteca de download gratuito do extrator de páginas do Word on-line. Ele permite que você divida, combine, extraia, remova e reorganize uma única página ou uma coleção de páginas de formatos de documento suportados de Word, Excel, PowerPoint, Desenhos do Visio, PDF e HTML.
Você pode instalar a nuvem GroupDocs.Merger para extrair páginas do Word de seu aplicativo Node.js usando o seguinte comando no console:
npm install groupdocs-merger-cloud
Por favor, obtenha seu ID e Segredo do cliente no painel antes de seguir as etapas mencionadas. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:
# Importe o SDK do Node.js em seu aplicativo de nó de http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");
// obtenha clientId e clientSecret em https://dashboard.groupdocs.cloud (é necessário registro gratuito).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";
Extraia páginas do Word para um novo documento por números de página exatos
Você pode exportar páginas específicas do arquivo do Word programaticamente na nuvem seguindo as etapas simples mencionadas abaixo:
- Carregar o arquivo do Word para a nuvem
- Extract Páginas do Word usando API REST em Node.js
- Baixar os arquivos separados
Carregue o arquivo do Word
Em primeiro lugar, carregue o arquivo do Word para a nuvem usando o exemplo de código abaixo:
// abra o arquivo no IOStream da unidade do sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// ler arquivo
fs.readFile(resourcesFolder, (err, fileStream) => {
// construir FileApi
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// criar solicitação de upload de arquivo
var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
// subir arquivo
fileApi.uploadFile(request)
.then(function (response) {
console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
});
Como resultado, o arquivo do Word carregado estará disponível na seção de arquivos do seu painel na nuvem.
Extraia páginas do Word usando a API REST em Node.js
Você pode facilmente extrair páginas do arquivo do Word programaticamente seguindo as etapas abaixo:
- Em primeiro lugar, crie uma instância de PagesApi.
- Crie uma instância de ExtractOptions.
- Crie uma instância do FileInfo.
- Em seguida, defina o caminho para o arquivo do Word de entrada.
- Em seguida, defina o caminho para o arquivo do Word extraído.
- Defina números de página específicos em uma matriz separada por vírgulas para extrair o arquivo do Word.
- Crie ExtractRequest com ExtractOptions.
- Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.
O trecho de código a seguir mostra como extrair páginas do Word em arquivos separados usando a API REST no Node.js:
// Como extrair páginas do Word para um novo documento por números de página exatos
const extractwordpages = async () => {
// inicialização da API
global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);
// definir opções de extração
let options = new groupdocs_merger_cloud.ExtractOptions();
options.fileInfo = new groupdocs_merger_cloud.FileInfo();
options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx";
options.outputPath = "nodejs-testing/output-sample-file.docx";
options.pages = [2, 4, 7];
try {
// criar solicitação de extração
let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
// extrair páginas do arquivo docx
let result = await pagesApi.extract(extractRequest);
}
catch (err) {
throw err;
}
}
extractwordpages()
.then(() => {
console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
console.log("Error occurred while extracting pages from Word file:", err);
})
Baixe os arquivos extraídos
O exemplo de código acima salvará os arquivos separados na nuvem. Você pode baixá-los usando o seguinte exemplo de código:
// construir FileApi para baixar o arquivo mesclado
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// criar solicitação de download de arquivo
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// arquivo de download e tipo de resposta Stream
fileApi.downloadFile(request)
.then(function (response) {
// salve o arquivo no diretório do sistema
fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
console.log("Expected response type is Stream: " + response.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
Extrair páginas de documentos do Word por intervalo de páginas usando a API REST em Node.js
Você pode extrair e salvar páginas de um Word separadamente, fornecendo um intervalo de números de página programaticamente seguindo as etapas abaixo:
- Em primeiro lugar, crie uma instância de PagesApi.
- Crie uma instância de ExtractOptions.
- Crie uma instância do FileInfo.
- Em seguida, defina o caminho para o arquivo do Word de entrada.
- Em seguida, defina o caminho para o arquivo do Word extraído.
- Defina os valores startPageNumber e endPageNumber.
- Em seguida, defina o rangeMode como EvenPages ou OddPages
- Crie ExtractRequest com ExtractOptions.
- Por fim, chame o método pagesApi.extract() com ExtractRequest para obter os resultados.
O trecho de código a seguir mostra como extrair páginas do Word online usando o intervalo de páginas e o modo de página no Node.js:
// Como extrair páginas de documentos do Word por intervalo de páginas usando a API REST no Node.js
const extractpages = async () => {
// inicialização da API
global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);
// definir opções de extração
let options = new groupdocs_merger_cloud.ExtractOptions();
options.fileInfo = new groupdocs_merger_cloud.FileInfo();
options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx";
options.outputPath = "nodejs-testing/output-sample-file.docx";
options.startPageNumber = 1;
options.endPageNumber = 10;
options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
try {
// criar solicitação de extração
let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
// extrair páginas de arquivos do Word
let result = await pagesApi.extract(extractRequest);
}
catch (err) {
throw err;
}
}
extractpages()
.then(() => {
console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
console.log("Error occurred while extracting pages from Word file.", err);
})
Da mesma forma, você pode extrair páginas ímpares de documentos do Word.
Experimente on-line
Como extrair páginas de um documento do Word online? Tente a seguinte ferramenta online gratuita de extração do Word para extrair páginas do Word online gratuitamente. Esta ferramenta on-line gratuita do extrator de páginas do Word foi desenvolvida usando a API acima.
Conclusão
Neste artigo, você aprendeu:
- como extrair certas páginas do documento do Word online usando a API REST;
- como extrair páginas do documento do Word usando intervalo de páginas e filtro de modo de intervalo;
- carregue o arquivo do Word para a nuvem para exportar as páginas selecionadas do Word online;
- baixe e salve certas páginas do Word da nuvem;
- como extrair páginas do Word grátis;
Agora você sabe como extrair todas as páginas de um documento do Word ou como salvar algumas páginas de um documento do Word. A API também permite que você reordene ou substitua páginas de documentos, altere a orientação da página, gerencie senhas de documentos e execute outras manipulações facilmente para qualquer formato de arquivo compatível. Além disso, você pode aprender mais sobre GroupDocs.Merge Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador.
Faça uma pergunta
Você pode fazer suas perguntas sobre o extrator de páginas do Word para exportar páginas selecionadas do Word, através do nosso Fórum de suporte gratuito
perguntas frequentes
Como extrair várias páginas do Word em um arquivo?
Instale a biblioteca JS para separar arquivos do Word em várias páginas online de forma programática. Você pode visitar a documentação para obter detalhes completos da API.
Quanto tempo leva para extrair páginas específicas do Word?
Biblioteca JavaScript HTML para Word funciona muito rápido e você pode extrair páginas do Word protegido facilmente em alguns segundos.
Veja também
- Junte arquivos PDF no One Online usando Node.js
- Extrair páginas de documentos do Word em Python
- Combine várias apresentações do PowerPoint em uma
- Mesclar arquivos PDF usando uma API REST
- Como combinar arquivos PowerPoint PPT/PPTX em Python
- Combine vários documentos do Word usando Python
- Dividir documento do Word em vários arquivos usando Node.js
- Como dividir slides PowerPoint PPT ou PPTX em Python