كيفية استخراج الصفحات من ملف PDF باستخدام Rest API في Node.js

كيفية استخراج الصفحات من ملفات PDF باستخدام Rest API في Node.js

قد تحتاج إلى استخراج عدة صفحات من PDF دفعة واحدة برمجيًا. من خلال فصل صفحات PDF ، يمكنك بسهولة تصدير وحفظ صفحات معينة من مستندات PDF لمشاركتها مع أصحاب المصلحة. بصفتك مطور Node.js ، يمكنك استخراج صفحات متعددة من مستندات PDF على السحابة. في هذه المقالة ، سنشرح كيفية استخراج الصفحات من ملف PDF باستخدام Rest API في Node.js.

سيتم تناول الموضوعات التالية في هذه المقالة لإزالة الصفحات من ملف PDF:

PDF Extractor REST API و Node.js SDK

لاستخراج صفحات من Adobe Acrobat PDF ، سأستخدم Node.js SDK من GroupDocs.Merger Cloud API. إنها مكتبة تنزيل مجانية لمستخرج صفحات PDF عبر الإنترنت. يسمح لك بتقسيم ودمج واستخراج وإزالة وإعادة ترتيب صفحة واحدة أو مجموعة من الصفحات من تنسيقات المستندات المدعومة من Word و Excel و [PowerPoint] 9 و رسومات Visio و PDF و HTML.

يمكنك تثبيت سحابة GroupDocs.Merger لاستخراج صفحات PDF من ملفات PDF في تطبيق Node.js الخاص بك باستخدام الأمر التالي في وحدة التحكم:

npm install groupdocs-merger-cloud

يرجى الحصول على معرف العميل والسرية من لوحة التحكم قبل اتباع الخطوات المذكورة. بمجرد حصولك على المعرف والسر الخاص بك ، قم بإضافة الرمز كما هو موضح أدناه:

# قم باستيراد Node.js SDK في تطبيق العقدة من http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// احصل على clientId و clientSecret من https://dashboard.groupdocs.cloud (التسجيل المجاني مطلوب).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

استخراج صفحات PDF عن طريق أرقام الصفحات بالضبط باستخدام REST API في Node.js

يمكنك تصدير صفحة واحدة من PDF أو تصدير صفحات معينة من ملفات PDF برمجيًا على السحابة باتباع الخطوات البسيطة المذكورة أدناه:

قم بتحميل ملف PDF

يمكنك البدء باستيراد ملف PDF إلى السحابة باستخدام مثال الرمز الموضح أدناه:

// افتح الملف في IOStream من محرك أقراص النظام.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// إقرا الملف
fs.readFile(resourcesFolder, (err, fileStream) => {
  // بناء FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // طلب إنشاء ملف تحميل
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // رفع ملف
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

سيكون ملف PDF متاحًا عند تحميل الملف في قسم الملفات من لوحة التحكم على السحابة.

استخراج صفحات PDF باستخدام REST API في Node.js

ستعلمك الخطوات أدناه كيفية استخراج الصفحات برمجيًا من ملف PDF:

  • أولاً ، قم بإنشاء مثيل لـ PagesApi.
  • إنشاء مثيل ExtractOptions.
  • قم بإنشاء مثيل FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى ملف PDF المدخل.
  • بعد ذلك ، قم بتعيين المسار إلى ملف PDF المستخرج.
  • قم بتعيين أرقام صفحات محددة في مصفوفة مفصولة بفواصل لاستخراج ملفات PDF.
  • قم بإنشاء ExtractRequest باستخدام ExtractOptions.
  • أخيرًا ، قم باستدعاء الأسلوب pagesApi.extract() باستخدام ExtractRequest للحصول على النتائج.

يوضح مقتطف الشفرة التالي كيفية استخراج صفحات PDF إلى ملفات منفصلة باستخدام REST API في Node.js:

// كيفية استخراج صفحات PDF عن طريق أرقام الصفحات بالضبط باستخدام REST API في Node.js
const extractpdfpages = async() => {

  // تهيئة API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // تحديد خيارات الاستخراج
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // إنشاء طلب استخراج
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // استخراج الصفحات من وثيقة pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

قم بتنزيل الملفات المستخرجة

نموذج الكود أعلاه سيحفظ الملفات المنفصلة على السحابة. يمكنك تنزيلها باستخدام نموذج التعليمات البرمجية التالي:

// إنشاء FileApi لتنزيل الملف المدمج
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// إنشاء طلب ملف تحميل
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// تنزيل الملف ونوع الاستجابة Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // حفظ الملف في دليل النظام الخاص بك
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

استخراج الصفحات من PDF حسب نطاق الصفحات باستخدام REST API في Node.js

يمكنك استخراج الصفحات من ملف PDF وحفظها بشكل منفصل عن طريق توفير مجموعة من أرقام الصفحات برمجيًا باتباع الخطوات الموضحة أدناه:

  • أولاً ، قم بإنشاء مثيل لـ PagesApi.
  • إنشاء مثيل ExtractOptions.
  • قم بإنشاء مثيل FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى ملف PDF المدخل.
  • بعد ذلك ، قم بتعيين المسار إلى ملف PDF المستخرج.
  • قم بتعيين رقم صفحة البداية وقيم رقم صفحة النهاية.
  • ثم قم بتعيين rangeMode كـ EvenPages أو OddPages
  • قم بإنشاء ExtractRequest باستخدام ExtractOptions.
  • أخيرًا ، قم باستدعاء الأسلوب pagesApi.extract() باستخدام ExtractRequest للحصول على النتائج.

يوضح مقتطف الشفرة التالي كيفية استخراج الصفحات من PDF عبر الإنترنت باستخدام نطاق الصفحات ووضع الصفحة في Node.js:

// كيفية استخراج الصفحات من PDF حسب نطاق الصفحات باستخدام REST API في Node.js
const extractpages = async() => {

  // تهيئة API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // تحديد خيارات الاستخراج
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // إنشاء طلب استخراج
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // استخراج صفحات ملف PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

بطريقة مماثلة ، يمكنك استخراج الصفحات الفردية من مستندات PDF.

جرب عبر الإنترنت

كيف تستخرج الصفحات من ملفات PDF عبر الإنترنت؟ يرجى تجربة أداة استخراج PDF المجانية عبر الإنترنت لاستخراج الصفحات من PDF مجانًا عبر الإنترنت. تم تطوير أداة استخراج صفحات PDF المجانية عبر الإنترنت باستخدام واجهة برمجة التطبيقات المذكورة أعلاه.

خاتمة

نحن نختتم منشور المدونة هذا هنا. لقد تعلمت في هذا المقال:

  • كيفية استخراج صفحات معينة من PDF أو استخراج صفحة واحدة من PDF عبر الإنترنت باستخدام REST API ؛
  • كيفية استخراج الصفحات من مستندات PDF باستخدام نطاق الصفحات وفلتر وضع النطاق ؛
  • تحميل ملف PDF إلى السحابة لتصدير الصفحات المحددة من PDF عبر الإنترنت ؛
  • تنزيل وحفظ صفحات معينة من PDF من السحابة ؛
  • كيفية استخراج صفحات من ملف PDF مجانًا ؛

الآن ، أنت تعرف كيفية استخراج صفحة واحدة من مستند PDF أو كيفية حفظ صفحات معينة من ملف PDF. تمكّنك واجهة برمجة التطبيقات أيضًا من إعادة ترتيب صفحات المستند أو استبدالها ، وتغيير اتجاه الصفحة ، وإدارة كلمات مرور المستندات ، وإجراء معالجات أخرى بسهولة لأي تنسيق ملف مدعوم. بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Merge Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح.

بالإضافة إلى ذلك ، ننصحك بالرجوع إلى دليل البدء.

بالإضافة إلى ذلك ، يكتب groupdocs.cloud بانتظام مقالات حول مواضيع جديدة. لذا يرجى البقاء على اتصال للحصول على آخر التحديثات.

طرح سؤال

يمكنك طرح استفساراتك حول كيفية استخراج ملفات PDF لتصدير الصفحات المحددة من PDF ، عبر منتدى الدعم المجاني

أسئلة وأجوبة

كيف تستخرج صفحات متعددة من ملف PDF في ملف واحد؟

قم بتثبيت مكتبة JS لفصل ملفات PDF إلى صفحات متعددة عبر الإنترنت برمجيًا. يمكنك زيارة الوثائق للحصول على تفاصيل API كاملة.

كم من الوقت يستغرق استخراج صفحات معينة من PDF؟

JavaScript HTML to PDF library يعمل بسرعة كبيرة ويمكنك استخراج الصفحات من PDF المحمي بسهولة في بضع ثوان.

أنظر أيضا

للحصول على أفضل قراءة ومعلومات ، يرجى زيارة المقالات التالية: