Як витягти сторінки з PDF-файлу за допомогою Rest API у Node.js

Як видобувати сторінки з PDF-файлів за допомогою Rest API у Node.js

Можливо, вам знадобиться видобути декілька сторінок із PDF одночасно програмним шляхом. Відокремлюючи PDF-сторінки, ви можете легко експортувати та зберігати певні сторінки PDF-документів, щоб поділитися ними з зацікавленими сторонами. Як розробник Node.js ви можете видобувати кілька сторінок із PDF-документів у хмарі. У цій статті ми продемонструємо, як видобувати сторінки з PDF-файлу за допомогою Rest API у Node.js.

У цій статті розглядатимуться такі теми, як отримати сторінки з PDF:

PDF Extractor REST API та Node.js SDK

Щоб отримати сторінки з PDF-файлу Adobe Acrobat, я буду використовувати Node.js SDK GroupDocs.Merger Cloud API. Це онлайнова бібліотека для безкоштовного завантаження PDF-сторінок. Він дозволяє вам розділяти, об’єднувати, витягувати, видаляти та змінювати порядок однієї сторінки чи колекції сторінок із підтримуваних форматів документів у Word, Excel, PowerPoint, Малюнки Visio, PDF і HTML.

Ви можете встановити хмару GroupDocs.Merger, щоб видобувати PDF-сторінки з PDF-файлів у своїй програмі Node.js за допомогою такої команди в консолі:

npm install groupdocs-merger-cloud

Будь ласка, отримайте свій ідентифікатор клієнта та секрет на інформаційній панелі, перш ніж виконувати вказані дії. Отримавши ідентифікатор і секрет, додайте код, як показано нижче:

# Імпортуйте Node.js SDK у свою програму вузла з http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// отримати clientId і clientSecret з https://dashboard.groupdocs.cloud (потрібна безкоштовна реєстрація).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Видобувайте сторінки PDF за точними номерами сторінок за допомогою REST API у Node.js

Ви можете експортувати одну сторінку з PDF-файлу або експортувати окремі сторінки з PDF-файлів програмним шляхом у хмарі, виконавши прості кроки, наведені нижче:

Завантажте файл PDF

Ви можете почати з імпорту PDF-файлу в хмару за допомогою прикладу коду, наведеного нижче:

// відкрити файл у IOStream із системного диска.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// читати файл
fs.readFile(resourcesFolder, (err, fileStream) => {
  // побудувати FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // створити запит на завантаження файлу
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // завантажити файл
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

PDF-файл стане доступним, коли його буде завантажено в розділ файлів вашої інформаційної панелі в хмарі.

Розпакуйте PDF-сторінки за допомогою REST API у Node.js

Наведені нижче кроки навчать вас, як програмно видобувати сторінки з файлу PDF.

  • По-перше, створіть екземпляр PagesApi.
  • Створіть екземпляр ExtractOptions.
  • Створіть екземпляр FileInfo.
  • Потім встановіть шлях до вхідного файлу PDF.
  • Далі встановіть шлях до видобутого файлу PDF.
  • Встановіть певні номери сторінок у масиві, розділеному комами, щоб видобути файли PDF.
  • Створіть ExtractRequest за допомогою ExtractOptions.
  • Нарешті, викличте метод pagesApi.extract() із ExtractRequest, щоб отримати результати.

У наведеному нижче фрагменті коду показано, як видобувати PDF-сторінки в окремі файли за допомогою REST API у Node.js:

// Як видобувати PDF-сторінки за точними номерами сторінок за допомогою REST API у Node.js
const extractpdfpages = async () => {

  // ініціалізація API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // визначити параметри вилучення
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // створити запит на вилучення
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // витягти сторінки з документа pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Завантажте витягнуті файли

Наведений вище приклад коду збереже розділені файли в хмарі. Ви можете завантажити їх за допомогою наступного зразка коду:

// створити FileApi для завантаження об’єднаного файлу
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// створити запит на завантаження файлу
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// завантажити файл і тип відповіді Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // збережіть файл у своєму системному каталозі
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Витягуйте сторінки з PDF за діапазоном сторінок за допомогою REST API у Node.js

Ви можете окремо витягувати та зберігати сторінки з PDF-файлу, запрограмувавши діапазон номерів сторінок, виконавши наведені нижче дії.

  • По-перше, створіть екземпляр PagesApi.
  • Створіть екземпляр ExtractOptions.
  • Створіть екземпляр FileInfo.
  • Потім встановіть шлях до вхідного файлу PDF.
  • Далі встановіть шлях до видобутого файлу PDF.
  • Установіть значення номера початкової та кінцевої сторінок.
  • Потім встановіть RangMode як EvenPages або OddPages
  • Створіть ExtractRequest за допомогою ExtractOptions.
  • Нарешті, викличте метод pagesApi.extract() із ExtractRequest, щоб отримати результати.

У наведеному нижче фрагменті коду показано, як видобувати сторінки з PDF-файлу онлайн за допомогою діапазону сторінок і режиму сторінок у Node.js:

// Як видобувати сторінки з PDF за діапазоном сторінок за допомогою REST API у Node.js
const extractpages = async () => {

  // ініціалізація API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // визначити параметри вилучення
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // створити запит на вилучення
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // витягти сторінки файлу PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

Подібним чином ви можете витягти непарні сторінки з документів PDF.

Спробуйте онлайн

Як витягти сторінки з файлів PDF онлайн? Будь ласка, спробуйте безкоштовний онлайн-інструмент для вилучення PDF-файлів, щоб безкоштовно видобувати сторінки з PDF-файлів онлайн. Цей безкоштовний онлайн-інструмент для вилучення сторінок PDF розроблено з використанням вищезгаданого API.

Висновок

Ми завершуємо цю публікацію в блозі. У цій статті ви дізналися:

  • як витягти певні сторінки з PDF або витягти одну сторінку з PDF онлайн за допомогою REST API;
  • як видобувати сторінки з PDF-документів за допомогою діапазону сторінок і фільтра в режимі діапазону;
  • завантажити PDF-файл у хмару, щоб експортувати вибрані сторінки з PDF-файлу онлайн;
  • завантажувати та зберігати певні сторінки PDF з хмари;
  • як безкоштовно витягувати сторінки з PDF;

Тепер ви знаєте, як витягнути одну сторінку з документа PDF або як зберегти певні сторінки PDF-документа. API також дозволяє змінювати порядок або замінювати сторінки документа, змінювати орієнтацію сторінки, керувати паролями документів і легко виконувати інші маніпуляції для будь-якого підтримуваного формату файлу. Крім того, ви можете дізнатися більше про GroupDocs.Merge Cloud API за допомогою документації. Ми також надаємо розділ API Reference, який дозволяє візуалізувати наші API та взаємодіяти з ними безпосередньо через браузер.

Крім того, радимо ознайомитися з нашим Посібником із початку роботи.

Крім того, groupdocs.cloud регулярно пише статті на нові теми. Тож будь ласка, залишайтеся на зв’язку, щоб отримати останні оновлення.

Задайте питання

Ви можете поставити свої запитання про те, як видобути PDF-файли, щоб експортувати вибрані сторінки з PDF-файлу, на нашому безкоштовному форумі підтримки

поширені запитання

Як витягти кілька сторінок із PDF в один файл?

Установіть JS-бібліотеку для програмного поділу PDF-файлів на кілька сторінок онлайн. Ви можете відвідати документацію, щоб отримати повну інформацію про API.

Скільки часу потрібно, щоб витягти певні сторінки з PDF?

Бібліотека JavaScript HTML у PDF працює дуже швидко, і ви можете легко витягувати сторінки із захищеного PDF-файлу за кілька секунд.

Дивись також

Для найкращого читання та інформації перегляньте такі статті: