استخراج الصور من ملفات PDF باستخدام Node.js

PDF المستندات تحافظ على المحتوى بما في ذلك الصور والنصوص كما هي. في بعض الحالات ، قد نحتاج إلى استخراج الصور من ملفات أكروبات PDF لإعادة استخدامها. يمكننا بسهولة استخراج جميع الصور أو الصور من صفحات معينة مضمنة في مستندات PDF برمجيًا على السحابة. في هذه المقالة ، سوف نتعلم كيفية استخراج الصور من ملفات PDF باستخدام واجهة برمجة تطبيقات REST في Node.js.

سيتم تغطية الموضوعات التالية لاستخراج الصور من ملف pdf في هذه المقالة:

واجهة برمجة تطبيقات REST لاستخراج الصور و Node.js SDK

لاستخراج الصور من مستندات PDF ، سنستخدم Node.js SDK من GroupDocs.Parser Cloud API. يسمح باستخراج النص والصور وتحليل البيانات بواسطة قالب من جميع تنسيقات المستندات الشائعة. الرجاء تثبيته باستخدام الأمر التالي في وحدة التحكم:

npm install groupdocs-parser-cloud

يرجى الحصول على معرف العميل والسرية من لوحة التحكم قبل اتباع الخطوات المذكورة. بمجرد حصولك على المعرف والسر الخاص بك ، قم بإضافة الرمز كما هو موضح أدناه:

// يوضح مثال الرمز هذا كيفية إضافة معرف cliend الخاص بك والسرية في الكود.
global.clientId = '659fe7da-715b-4744-a0f7-cf469a392b73';
global.clientSecret = 'b377c36cfa28fa69960ebac6b6e36421';
global.myStorage = "";

const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";

استخراج الصور من PDF باستخدام واجهة برمجة تطبيقات REST في Node.js

يمكننا استخراج الصور من مستندات PDF باتباع الخطوات البسيطة المذكورة أدناه:

قم بتحميل المستند

أولاً ، سنقوم بتحميل مستند PDF الذي يحتوي على صور إلى السحابة باستخدام نموذج الكود الموضح أدناه:

// يوضح مثال الرمز هذا كيفية تحميل ملف PDF إلى السحابة في node.js 
// بناء FileApi
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// مسار ملف الإدخال
let resourcesFolder = 'C:\\Files\\Parser\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // طلب رفع الملف
  let request = new groupdocs_parser_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // رفع ملف
  fileApi.uploadFile(request);
});

نتيجة لذلك ، سيكون ملف PDF الذي تم تحميله متاحًا في قسم الملفات من لوحة المعلومات على السحابة. هذا الملف متاح لاستخراج صورة من ملف pdf.

استخراج جميع الصور من ملف PDF في Node.js

الآن ، سنستخرج جميع الصور من ملف PDF الذي تم تحميله برمجيًا باتباع الخطوات الموضحة أدناه:

  • أولاً ، قم بإنشاء مثيل لـ ParseApi.
  • بعد ذلك ، قم بتوفير مسار ملف PDF الذي تم تحميله.
  • ثم ، حدد ImageOptions وقم بتعيين الملف.
  • بعد ذلك ، قم بإنشاء ImagesRequest باستخدام ImageOptions كوسيطة.
  • أخيرًا ، استخرج الصور باستدعاء طريقة images().

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج جميع الصور من ملف PDF باستخدام REST API في Node.js.

// يوضح مثال الكود هذا كيفية استخراج جميع الصور من ملف PDF في Node.js.
//تهيئة API
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// مسار ملف الإدخال
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";

// تحديد خيارات الصورة
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// طلب صورة
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// استخراج الصور
let result = await parseApi.images(request);

// أظهر النتائج
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
استخراج الصور من PDF باستخدام واجهة برمجة تطبيقات REST في Node.js

استخراج الصور من PDF باستخدام واجهة برمجة تطبيقات REST في Node.js

تنزيل الصور المستخرجة

نموذج الكود أعلاه سيحفظ الصور المستخرجة على السحابة. يمكننا تنزيل هذه الصور باستخدام نموذج الشفرة الوارد أدناه:

// يوضح مثال الرمز هذا كيفية تنزيل الصور من السحابة باستخدام Node.js
// بناء مثيلات API ضرورية
var folderApi = groupdocs_parser_cloud.FolderApi.fromConfig(configuration);
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// طلب قائمة الملفات
var filesListRequest = new groupdocs_parser_cloud.GetFilesListRequest("parser/images/sample_pdf/", myStorage);

// الحصول على قائمة الملفات
var filesList = await folderApi.getFilesList(filesListRequest);

for (var count = 0; count < filesList.value.length; count++) {
  // طلب تحميل الملف
  let request = new groupdocs_parser_cloud.DownloadFileRequest(filesList.value[count].path, myStorage);

  // تحميل الملف
  let response = await fileApi.downloadFile(request);

  // احفظ الملف في المجلد الموجود على القرص
  fs.writeFile("C:\\Files\\parser\\images\\" + filesList.value[count].name, response, "binary", function (err) { });
  console.log(response);
}

هذه هي طريقة تصدير الصورة من ملف pdf ثم تنزيلها من السحابة.

حفظ الصور بأرقام الصفحات من مستندات PDF في Node.js

يمكننا تصدير صورة من صفحات محددة بتنسيق PDF بدلاً من المستند بأكمله باتباع الخطوات الموضحة أدناه.

  • أولاً ، قم بإنشاء مثيل لـ ParseApi.
  • بعد ذلك ، قم بتوفير مسار ملف PDF الذي تم تحميله.
  • ثم ، حدد ImageOptions وقم بتعيين الملف.
  • قم بتعيين رقم صفحة البداية والعدد الإجمالي للصفحات من حيث يتم استخراج الصور.
  • بعد ذلك ، قم بإنشاء ImagesRequest باستخدام ImageOptions كوسيطة.
  • أخيرًا ، استخرج الصور باستدعاء طريقة images().

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج الصور من ملف pdf بأرقام الصفحات من مستند PDF باستخدام واجهة برمجة تطبيقات REST في Node.js. برجاء اتباع الخطوات المذكورة سابقاً لتنزيل الصور المستخرجة.

// يوضح مثال الكود هذا كيفية استخراج الصور من صفحات معينة من ملف PDF في Node.js.
//تهيئة API
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// مسار ملف الإدخال
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";

// تحديد خيارات الصورة
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 1;      // Start page number
options.countPagesToExtract = 1;  // Total pages

// طلب صورة
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// استخراج الصور
let result = await parseApi.images(request);

// أظهر النتائج
let pages = result.pages;
pages.forEach(page => {
  console.log("Page index: " + page.pageIndex);
  page.images.forEach(image => {
    console.log("Download url: " + image.downloadUrl);
    console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
  });
});

استخراج الصور من المستند المرفق مع PDF في Node.js

يمكننا أيضًا استخراج الصور من مستند داخل حاوية ، متاح كمرفق في ملف PDF ، باتباع الخطوات الواردة أدناه.

  • أولاً ، قم بإنشاء مثيل لـ ParseApi.
  • بعد ذلك ، قم بتوفير مسار ملف PDF الذي تم تحميله.
  • ثم ، حدد ImageOptions وقم بتعيين الملف.
  • بعد ذلك ، حدد ContainerItemInfo وقم بتوفير المسار النسبي للمستند الداخلي.
  • بعد ذلك ، قم بإنشاء ImagesRequest باستخدام ImageOptions كوسيطة.
  • أخيرًا ، استخرج الصور عن طريق استدعاء طريقة images().

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج الصور من مستند داخل مستند PDF باستخدام REST API في Node.js. برجاء اتباع الخطوات المذكورة سابقاً لتنزيل الصور المستخرجة.

// يوضح مثال الكود هذا كيفية استخراج الصور من مستند مرفق في ملف PDF في Node.js.
// تهيئة API
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// مسار ملف الإدخال
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "PDF_with_Attachment.pdf";
fileInfo.password = "password";

// تحديد خيارات الصورة
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// عنصر الحاوية
options.ContainerItemInfo = new groupdocs_parser_cloud.ContainerItemInfo();
options.ContainerItemInfo.relativePath = "template-document.pdf";

// طلب صورة
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// استخراج الصور
let result = await parseApi.images(request);

// أظهر النتائج
let images = result.images;
images.forEach(image => {
  console.log("Image path: " + image.path);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});

جرب عبر الإنترنت

كيف تستخرج الصور من pdf مجاناً؟ يرجى تجربة أداة تحليل PDF المجانية التالية عبر الإنترنت لاستخراج صور pdf عبر الإنترنت ، والتي تم تطويرها باستخدام واجهة برمجة التطبيقات المذكورة أعلاه. https://products.groupdocs.app/parser/pdf

خاتمة

في هذه المقالة ، تعلمنا كيفية:

  • استخراج الصور من ملفات PDF باستخدام Node.js على السحابة ؛
  • تحميل ملف PDF برمجيًا إلى السحابة ؛
  • تنزيل الصور المستخرجة من السحابة.

بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. في حالة وجود أي غموض ، فلا تتردد في الاتصال بنا على المنتدى.

أنظر أيضا