Cara Mengekstrak Halaman dari File PDF menggunakan Rest API di Node.js

Cara Mengekstrak Halaman dari File PDF menggunakan Rest API di Node.js

Anda mungkin perlu mengekstrak beberapa halaman dari PDF sekaligus secara terprogram. Dengan memisahkan halaman PDF, Anda dapat dengan mudah mengekspor dan menyimpan halaman tertentu dari dokumen PDF untuk dibagikan dengan pemangku kepentingan. Sebagai pengembang Node.js, Anda dapat mengekstrak banyak halaman dari dokumen PDF di cloud. Pada artikel ini, kami akan mendemonstrasikan cara mengekstrak halaman dari file PDF menggunakan Rest API di Node.js.

Topik-topik berikut akan dibahas dalam artikel ini untuk mengeluarkan halaman dari PDF:

PDF Extractor REST API dan Node.js SDK

Untuk mengekstrak halaman dari PDF adobe acrobat, saya akan menggunakan Node.js SDK dari GroupDocs.Merger Cloud API. Ini adalah perpustakaan unduhan gratis ekstraktor halaman PDF online. Ini memungkinkan Anda untuk memisahkan, menggabungkan, mengekstrak, menghapus, dan mengatur ulang satu halaman atau kumpulan halaman dari format dokumen yang didukung dari Word, Excel, PowerPoint, gambar Visio, PDF, dan HTML.

Anda dapat menginstal cloud GroupDocs.Merger untuk mengekstrak halaman PDF dari file PDF di aplikasi Node.js Anda menggunakan perintah berikut di konsol:

npm install groupdocs-merger-cloud

Harap dapatkan ID dan Rahasia Klien Anda dari dasbor sebelum mengikuti langkah-langkah yang disebutkan. Setelah Anda memiliki ID dan rahasia Anda, tambahkan kode seperti yang ditunjukkan di bawah ini:

# Impor Node.js SDK di aplikasi node Anda dari http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// dapatkan clientId dan clientSecret dari https://dashboard.groupdocs.cloud (diperlukan pendaftaran gratis).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Ekstrak Halaman PDF dengan Nomor Halaman Tepat menggunakan REST API di Node.js

Anda dapat mengekspor satu halaman dari PDF atau mengekspor halaman tertentu dari file PDF secara terprogram di cloud dengan mengikuti langkah-langkah sederhana yang disebutkan di bawah ini:

  • Unggah file PDF ke Cloud
  • Ekstrak halaman PDF menggunakan REST API di Node.js
  • Unduh file yang terpisah

Unggah File PDF

Anda dapat memulai dengan mengimpor file PDF ke cloud menggunakan contoh kode di bawah ini:

// buka file di IOStream dari drive sistem Anda.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// membaca berkas
fs.readFile(resourcesFolder, (err, fileStream) => {
  // membangun FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // buat permintaan unggah file
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // unggah data
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

File PDF akan tersedia saat file diunggah di bagian file dasbor Anda di cloud.

Ekstrak Halaman PDF menggunakan REST API di Node.js

Langkah-langkah di bawah ini akan mengajarkan Anda cara mengekstrak halaman dari file PDF secara terprogram:

  • Pertama, buat instance dari PagesApi.
  • Buat instance dari ExtractOptions.
  • Buat instance FileInfo.
  • Kemudian, atur path ke file PDF input.
  • Selanjutnya, atur jalur ke file PDF yang diekstraksi.
  • Tetapkan nomor halaman tertentu dalam larik yang dipisahkan koma untuk mengekstrak file PDF.
  • Buat ExtractRequest dengan ExtractOptions.
  • Terakhir, panggil metode pagesApi.extract() dengan ExtractRequest untuk mendapatkan hasil.

Cuplikan kode berikut menunjukkan cara mengekstrak halaman PDF menjadi file terpisah menggunakan REST API di Node.js:

// Cara Mengekstrak Halaman PDF dengan Nomor Halaman Tepat menggunakan REST API di Node.js
const extractpdfpages = async () => {

  // inisialisasi api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // menentukan pilihan ekstrak
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // buat permintaan ekstrak
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // ekstrak halaman dari dokumen pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Unduh File yang Diekstraksi

Contoh kode di atas akan menyimpan file yang terpisah di cloud. Anda dapat mengunduhnya menggunakan contoh kode berikut:

// buat FileApi untuk mengunduh file gabungan
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// buat permintaan donwload file
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// unduh file dan jenis respons Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // simpan file di direktori sistem Anda
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Ekstrak Halaman dari PDF berdasarkan Rentang Halaman menggunakan REST API di Node.js

Anda dapat mengekstrak dan menyimpan halaman dari PDF secara terpisah dengan menyediakan rentang nomor halaman secara terprogram dengan mengikuti langkah-langkah berikut:

  • Pertama, buat instance dari PagesApi.
  • Buat instance dari ExtractOptions.
  • Buat instance FileInfo.
  • Kemudian, atur path ke file PDF input.
  • Selanjutnya, atur jalur ke file PDF yang diekstraksi.
  • Tetapkan nomor halaman awal dan nilai nomor halaman akhir.
  • Kemudian, atur rangeMode sebagai EvenPages atau OddPages
  • Buat ExtractRequest dengan ExtractOptions.
  • Terakhir, panggil metode pagesApi.extract() dengan ExtractRequest untuk mendapatkan hasil.

Cuplikan kode berikut menunjukkan cara mengekstrak halaman dari PDF online menggunakan rentang halaman dan mode halaman di Node.js:

// Cara Mengekstrak Halaman dari PDF berdasarkan Rentang Halaman menggunakan REST API di Node.js
const extractpages = async () => {

  // inisialisasi api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // menentukan pilihan ekstrak
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // buat permintaan ekstrak
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // ekstrak halaman file PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

Cara serupa, Anda dapat mengekstrak halaman ganjil dari dokumen PDF.

Coba Daring

Bagaimana cara mengekstrak halaman dari file PDF secara online? Silakan coba [alat ekstraktor PDF online gratis] berikut 22 untuk mengekstrak halaman dari PDF online gratis. Alat online gratis ekstraktor halaman PDF ini dikembangkan menggunakan API di atas.

Kesimpulan

Kami mengakhiri posting blog ini di sini. Dalam artikel ini, Anda telah mempelajari:

  • cara mengekstrak halaman tertentu dari PDF atau mengekstrak satu halaman dari PDF online menggunakan REST API;
  • cara mengekstrak halaman dari dokumen PDF menggunakan rentang halaman dan filter mode rentang;
  • unggah file PDF ke cloud untuk mengekspor halaman yang dipilih dari PDF online;
  • unduh dan simpan halaman PDF tertentu dari cloud;
  • cara mengekstrak halaman dari PDF gratis;

Sekarang, Anda tahu cara mengekstrak satu halaman dari dokumen PDF atau cara menyimpan halaman PDF tertentu. API juga memungkinkan Anda untuk menyusun ulang atau mengganti halaman dokumen, mengubah orientasi halaman, mengelola kata sandi dokumen, dan melakukan manipulasi lainnya dengan mudah untuk semua format file yang didukung. Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Merge Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser.

Selain itu, kami menyarankan Anda untuk merujuk ke Panduan Memulai

Selain itu, groupdocs.cloud secara teratur menulis artikel tentang topik baru. Jadi harap tetap berhubungan untuk update terbaru.

Berikan pertanyaan

Anda dapat mengajukan pertanyaan tentang cara mengekstrak file PDF untuk mengekspor halaman yang dipilih dari PDF, melalui Forum Dukungan Gratis kami

FAQ

Bagaimana cara mengekstrak banyak halaman dari PDF menjadi satu file?

Instal JS library untuk memisahkan file PDF menjadi beberapa halaman online secara terprogram. Anda dapat mengunjungi dokumentasi untuk detail API lengkap.

Berapa lama untuk mengekstrak halaman tertentu dari PDF?

JavaScript HTML to PDF library bekerja sangat cepat dan Anda dapat mengekstrak halaman dari PDF yang dilindungi dengan mudah dalam beberapa detik.

Lihat juga

Untuk bacaan dan informasi terbaik, silakan kunjungi artikel berikut: