Как извлечь страницы из документа Word онлайн с помощью Node.js

Как извлечь страницы из Word DOC/DOCX Online с помощью Node.js

Возможно, вам потребуется извлечь страницы документа word в несколько документов программным путем. Разделяя документы Word, вы можете легко извлечь страницу из документа Word и поделиться определенной информацией или данными с заинтересованными сторонами. Как разработчик Node.js, вы можете извлекать текстовый документ в отдельные файлы онлайн в облаке. В этой статье вы узнаете, как извлекать страницы из Word DOC/DOCX онлайн с помощью Node.js.

В этой статье должны быть раскрыты следующие темы:

Word Page Extractor Online REST API и Node.js SDK

Чтобы извлечь страницы из документа Word, я буду использовать API Node.js SDK для GroupDocs.Merger Cloud. Это бесплатная онлайн-библиотека для извлечения страниц Word. Он позволяет разделять, объединять, извлекать, удалять и изменять порядок одной страницы или набора страниц из поддерживаемых форматов документов из Word, Excel, PowerPoint. ], чертежи Visio, PDF и HTML.

Вы можете установить облако GroupDocs.Merger для извлечения страниц Word из вашего приложения Node.js с помощью следующей команды в консоли:

npm install groupdocs-merger-cloud

Пожалуйста, получите свой идентификатор клиента и секрет из панели управления, прежде чем выполнять указанные шаги. Получив свой идентификатор и секрет, добавьте код, как показано ниже:

# Импортируйте Node.js SDK в приложение узла с http://api.groupdocs.cloud.
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// получить clientId и clientSecret с https://dashboard.groupdocs.cloud (требуется бесплатная регистрация).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Извлечение страниц из Word в новый документ по точным номерам страниц

Вы можете программно экспортировать определенные страницы из файла Word в облако, выполнив простые шаги, указанные ниже:

Загрузите файл Word

Во-первых, загрузите файл Word в облако, используя приведенный ниже пример кода:

// откройте файл в IOStream с вашего системного диска.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// прочитать файл
fs.readFile(resourcesFolder, (err, fileStream) => {
  // построить FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // создать запрос на загрузку файла
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
  // загрузить файл
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

В результате загруженный файл Word будет доступен в разделе файлов вашей панели инструментов в облаке.

Извлечение страниц Word с помощью REST API в Node.js

Вы можете легко извлечь страницы файла Word программно, выполнив следующие действия:

  • Во-первых, создайте экземпляр PagesApi.
  • Создайте экземпляр ExtractOptions.
  • Создайте экземпляр FileInfo.
  • Затем укажите путь к входному файлу Word.
  • Затем укажите путь к извлеченному файлу Word.
  • Установите определенные номера страниц в массиве, разделенном запятыми, чтобы извлечь файл Word.
  • Создайте ExtractRequest с ExtractOptions.
  • Наконец, вызовите метод pagesApi.extract() с ExtractRequest, чтобы получить результаты.

В следующем фрагменте кода показано, как извлечь страницы Word в отдельные файлы с помощью REST API в Node.js:

// Как извлечь страницы из Word в новый документ по точным номерам страниц
const extractwordpages = async () => {

  // инициализация API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // определить параметры извлечения
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.pages = [2, 4, 7];
  
  try {
    // создать запрос на извлечение
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // извлечь страницы из файла docx
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractwordpages()
.then(() => {
  console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file:", err);
})

Загрузите извлеченные файлы

Приведенный выше пример кода сохранит разделенные файлы в облаке. Вы можете загрузить их, используя следующий пример кода:

// построить FileApi для загрузки объединенного файла
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// создать запрос на загрузку файла
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// скачать файл и тип ответа Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // сохранить файл в системном каталоге
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Извлечение страниц документа Word по диапазону страниц с помощью REST API в Node.js

Вы можете извлекать и сохранять страницы из Word отдельно, программно предоставляя диапазон номеров страниц, выполнив следующие шаги:

  • Во-первых, создайте экземпляр PagesApi.
  • Создайте экземпляр ExtractOptions.
  • Создайте экземпляр FileInfo.
  • Затем укажите путь к входному файлу Word.
  • Затем укажите путь к извлеченному файлу Word.
  • Задайте значения startPageNumber и endPageNumber.
  • Затем установите rangeMode как EvenPages или OddPages.
  • Создайте ExtractRequest с ExtractOptions.
  • Наконец, вызовите метод pagesApi.extract() с ExtractRequest, чтобы получить результаты.

В следующем фрагменте кода показано, как извлекать страницы из Word в Интернете, используя диапазон страниц и режим страницы в Node.js:

// Как извлечь страницы документа Word по диапазону страниц с помощью REST API в Node.js
const extractpages = async () => {

  // инициализация API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // определить параметры извлечения
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // создать запрос на извлечение
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // извлечь страницы файла Word
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file.", err);
})

Аналогичным образом вы можете извлечь нечетные страницы из документов Word.

Попробуйте онлайн

Как вырезать страницы из документа Word онлайн? Пожалуйста, попробуйте следующий бесплатный онлайн-инструмент для извлечения Word, чтобы бесплатно извлечь страницы из Word онлайн. Этот бесплатный онлайн-инструмент для извлечения страниц Word разработан с использованием вышеуказанного API.

Заключение

В этой статье вы узнали:

  • как извлечь определенные страницы из документа Word онлайн с помощью REST API;
  • как извлечь страницы из документа Word, используя диапазон страниц и фильтр режима диапазона;
  • загрузить файл Word в облако, чтобы экспортировать выбранные страницы из Word онлайн;
  • загружать и сохранять определенные страницы Word из облака;
  • как вырезать страницы из Word бесплатно;

Теперь вы знаете, как извлечь все страницы из документа Word или как сохранить определенные страницы Word. API также позволяет вам переупорядочивать или заменять страницы документа, изменять ориентацию страниц, управлять паролями документов и легко выполнять другие манипуляции для любого поддерживаемого формата файлов. Кроме того, вы можете узнать больше о GroupDocs.Merge Cloud API, используя документацию. Мы также предоставляем раздел Справочник по API, который позволяет визуализировать наши API и взаимодействовать с ними непосредственно через браузер.

Задайте вопрос

Вы можете задать свои вопросы об экстракторе страниц Word для экспорта выбранных страниц из Word через наш Бесплатный форум поддержки.

Часто задаваемые вопросы

Как извлечь несколько страниц из Word в один файл?

Установите JS-библиотеку для разделения файлов Word на несколько страниц онлайн программным путем. Вы можете посетить документацию для получения полной информации об API.

Сколько времени занимает извлечение определенных страниц из Word?

Библиотека JavaScript HTML to Word работает очень быстро, и вы можете легко извлечь страницы из защищенного Word за несколько секунд.

Смотрите также