كيفية استخراج الصفحات من ملف PDF عبر الإنترنت في Python

استخراج الصفحات من ملف PDF عبر الإنترنت في Python

في بعض الحالات ، قد تحتاج إلى استخراج صفحات PDF من مستندات PDF أو قد تحتاج إلى فصل مستندات PDF الكبيرة إلى ملفات PDF أصغر. بصفتك مطور Python ، يمكنك بسهولة استخراج صفحات معينة من ملفات PDF عبر الإنترنت أو استخراج صفحات PDF حسب نطاق الصفحات برمجيًا. في هذه المقالة ، ستتعلم كيفية استخراج الصفحات من ملف PDF عبر الإنترنت في Python باستخدام REST API.

سيتم تناول الموضوعات التالية في هذه المقالة:

Document Extractor REST API و Python SDK

لاستخراج صفحات PDF من ملفات PDF عبر الإنترنت ، سأستخدم Python SDK من GroupDocs.Merger Cloud API. إنها حزمة SDK غنية بالميزات وعالية الأداء. تمكنك واجهة Python API هذه من استخراج صفحات PDF من مستند واحد إلى ملفات متعددة. توفر SDK وظائف لإعادة ترتيب أو حذف أو تبادل أو تدوير أو تغيير اتجاه الصفحة لمجموعة كاملة أو مفضلة من الصفحات. كما أنه يدعم عمليات التلاعب الأخرى لأي تنسيقات ملفات مدعومة مثل أوراق عمل PDF و Word و PowerPoint و Excel وما إلى ذلك. حاليًا ، يدعم .NET و Java و PHP و Ruby و Android و Node.js SDK كمستند [دمج] 5 أفراد عائلة Cloud API.

يمكنك تثبيت GroupDocs.Merger-Cloud في مشروع Python الخاص بك باستخدام الأمر التالي في وحدة التحكم:

pip install groupdocs_merger_cloud

يرجى الحصول على معرّف العميل وسر العميل من لوحة القيادة قبل البدء في اتباع الخطوات وأمثلة الكود المتاحة. بمجرد حصولك على المعرف والسر الخاصين بك ، أضف الرمز كما هو موضح أدناه:

# استيراد SDK اندماج groupdocs
import groupdocs_merger_cloud

# احصل على app_sid & app_key من https://dashboard.groupdocs.cloud بعد التسجيل المجاني.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# الحصول على تكوينات ملف API 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

كيفية استخراج صفحات معينة من PDF في Python باستخدام REST API

تتيح لك واجهة برمجة تطبيقات تقسيم ملفات PDF الخاصة بنا معاينة الصفحات التي تريد تقسيمها. يمكنك تحديد الصفحات بمجرد توفير عدد الصفحات التي تريد استخراجها. قسّم ملف PDF على الفور إلى صفحات فردية أو استخرج صفحات معينة من مستند PDF جديد. قم باستخراج صفحات PDF من ملفات PDF عبر الإنترنت باتباع الخطوات البسيطة المذكورة أدناه:

  1. تحميل ملف PDF على السحابة.
  2. استخراج صفحات PDF حسب أرقام الصفحات في بايثون.
  3. تحميل الملفات المستخرجة.

قم بتحميل المستند

بادئ ذي بدء ، قم بتحميل مستند PDF متعدد الصفحات إلى السحابة باستخدام مقتطف الشفرة الوارد أدناه:

# قم بتحميل ملف PDF إلى التخزين السحابي
# إنشاء مثيل لملف API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# طلب ملف تحميل المكالمة
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)

# قم بتحميل ملف PDF إلى السحابة
response = file_api.upload_file(request)
print(response.uploaded)

نتيجة لذلك ، سيتم تحميل ملف PDF إلى Cloud Storage وسيكون متاحًا في قسم الملفات من لوحة المعلومات الخاصة بك. نحذف جميع ملفاتك نهائيًا من السحابة خلال 24 ساعة بعد التحميل.

استخراج صفحات معينة من خلال أرقام الصفحات باستخدام Python

لاستخراج صفحة معينة أو صفحات متعددة من مستند PDF برمجيًا ، اتبع الخطوات المذكورة أدناه:

  • أولاً ، قم بإنشاء مثيل PagesApi
  • ثانيًا ، قم بتوفير مثيل ExtractOptions
  • الآن ، قم بتعيين مسار ملف الإدخال باستخدام مثيل FileInfo
  • بعد ذلك ، قم بتعيين مسار دليل الإخراج
  • ثم قم بتوفير أرقام الصفحات مفصولة بفواصل لاستخراجها
  • بعد ذلك ، اضبط الوضع على الصفحات
  • بعد ذلك ، قم بإنشاء مثيل ExtractRequest
  • أخيرًا ، احصل على النتائج عن طريق استدعاء فئة pagesApi.extract()

يوضح مثال الكود التالي كيفية استخراج الصفحات من خلال توفير أرقام صفحات محددة من مستند PDF باستخدام REST API:

# كيفية استخراج صفحات معينة من PDF في Python باستخدام REST API
try:
    # أنشئ مثيلاً لواجهة برمجة تطبيقات الصفحات
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
    options.output_path = "python-testing"
    options.pages = [2, 4, 7]        
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

قم بتنزيل ملف صفحات PDF المستخرج

سيحفظ نموذج الكود أعلاه الصفحات المستخرجة في ملفات PDF منفصلة على السحابة. يمكنك تنزيلها باستخدام نموذج التعليمات البرمجية التالي:

# تهيئة API لتنزيل الملف المحول
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# طلب إنشاء ملف تنزيل
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)

# قم بتنزيل الملف المحول
response = file_api.download_file(request)

# انقل الملف الذي تم تنزيله إلى دليلك
shutil.move(response, "H:\\groupdocs-cloud-data\\")

استخراج الصفحات من PDF حسب Page Range في Python باستخدام REST API

يرجى اتباع الخطوات المذكورة أدناه لاستخراج الصفحات من مستند PDF من خلال توفير نطاق صفحات برمجيًا.

  • أولاً ، قم بإنشاء مثيل PagesApi
  • بعد ذلك ، قم بتعيين ExtractOptions
  • قم بتعيين مسار ملف الإدخال مع مثيل FileInfo
  • بعد ذلك ، قم بتعيين مسار دليل الإخراج
  • قم بتوفير نطاق صفحات عن طريق تعيين رقم صفحة البداية ورقم صفحة النهاية لاستخراجها
  • الآن ، قم بتعيين الفاصل الزمني للوضع على الصفحات
  • قم بتعيين وضع النطاق على EvenPages أو OddPages
  • بعد ذلك ، قم بإنشاء مثيل ExtractRequest
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة pagesApi.extract()

يوضح مثال الكود التالي كيفية استخراج الصفحات من خلال توفير نطاق صفحات من مستند PDF باستخدام REST API. يرجى اتباع الخطوات المذكورة سابقاً لتحميل الملفات.

# كيفية استخراج الصفحات من PDF حسب نطاق الصفحات في Python باستخدام REST API
try:
    # قم بإنشاء مثيل لـ Document API
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
    options.output_path = "python-testing"
    options.start_page_number = 1
    options.end_page_number = 10
    options.range_mode = "EvenPages" # or set range_mode to "OddPages"
    options.mode = "Pages" # Mode Intervals
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

مستخرج صفحة PDF على الإنترنت مجانًا

كيف تستخرج صفحات من pdf مجاناً؟ يرجى تجربة أداة استخراج PDF المجانية عبر الإنترنت ، والتي تم تطويرها باستخدام واجهة برمجة التطبيقات المذكورة أعلاه.

تلخيص لما سبق

هذا يقودنا إلى خاتمة منشور المدونة. أتمنى أن تكون قد تعلمت:

  • كيفية استخراج صفحات معينة من مستندات PDF في بايثون ؛
  • تحميل ملف PDF برمجيًا ثم تنزيل الملفات المستخرجة من السحابة ؛
  • كيفية استخراج صفحات ملفات PDF باستخدام نطاق الصفحات باستخدام Python ؛

يمكنك معرفة المزيد حول GroupDocs.Merger Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح.

قد تكتشف المزيد من التفاصيل في صفحة البدء.

علاوة على ذلك ، يتم تحديث Groupdocs.cloud باستمرار بمواضيع جديدة. نتيجة لذلك ، ابق على اطلاع دائم بأحدث معلومات واجهات برمجة التطبيقات.

طرح سؤال

يمكنك طرح استفساراتك حول واجهة برمجة تطبيقات برنامج مستخرج صفحات PDF ، من خلال الدعم المجاني المنتدى

أسئلة وأجوبة

كيف تستخرج الصفحات من ملف PDF في بايثون؟

يرجى اتباع هذا الرابط لمعرفة مقتطف شفرة Python حول كيفية استخراج الصفحات من ملفات PDF في Python.

كيفية استخراج الصفحات من مستندات PDF عبر الإنترنت باستخدام REST API؟

قم بإنشاء مثيل PagesApi ، وقم بتعيين قيم ExtractOptions ، واستدعاء طريقة pagesApi.extract() باستخدام ExtractRequest لحفظ الصفحات المحددة من ملف PDF عبر الإنترنت.

كيفية تثبيت مكتبة تنزيل مجانية لمستخرج صفحات PDF؟

طريقة سهلة لاستخراج الصفحات من PDF هي استخدام Python SDK. يمكنك تثبيت مكتبة Python لمستخرج PDF لاستخراج صفحات متعددة من ملفات PDF برمجيًا.

كيف يمكنني استخراج صفحات PDF في وضع عدم الاتصال في Windows؟

يرجى زيارة هذا الرابط لتنزيل برنامج استخراج ملفات PDF لنظام التشغيل Windows. سيقوم برنامج التنزيل المجاني لمستخرج ملفات PDF هذا بتقسيم صفحات PDF في Windows بسرعة بنقرة واحدة.

أنظر أيضا