استخراج صفحات معينة من PDF

قد تحتاج إلى استخراج صفحات معينة من مستندات PDF أو قد تحتاج إلى تقسيم مستندات PDF الكبيرة إلى أجزاء أصغر. بصفتك مطور Python ، يمكنك بسهولة استخراج صفحات معينة من مستندات PDF بأرقام الصفحات أو عن طريق مجموعة من الصفحات برمجيًا. في هذه المقالة ، ستتعلم كيفية استخراج صفحات معينة من مستندات PDF باستخدام واجهة برمجة تطبيقات REST في Python.

سيتم تناول الموضوعات التالية في هذه المقالة:

واجهة برمجة تطبيقات Document Splitter REST و Python SDK

لاستخراج الصفحات من مستندات PDF ، سأستخدم Python SDK of GroupDocs.Merger Cloud API. إنها حزمة SDK غنية بالميزات وعالية الأداء تستخدم لدمج العديد من المستندات في مستند واحد. كما أنه يمكّنك من تقسيم مستند واحد إلى مستندات متعددة. يوفر SDK وظائف لحذف اتجاه الصفحة أو تبادله أو تدويره أو تغييره لمجموعة كاملة أو مفضلة من الصفحات وإجراء معالجات أخرى بسهولة لأي تنسيقات ملفات مدعومة مثل أوراق عمل PDF و Word و Powerpoint و Excel. حاليًا ، يوفر أيضًا .NET و Java و PHP و Ruby و Android و Node.js SDKs باعتبارها أعضاء عائلة دمج المستندات لواجهة برمجة التطبيقات السحابية.

يمكنك تثبيت GroupDocs.Merger-Cloud على مشروع Python الخاص بك باستخدام الأمر التالي في وحدة التحكم:

pip install groupdocs_merger_cloud

يرجى الحصول على معرّف العميل وسر العميل من لوحة القيادة قبل البدء في اتباع الخطوات وأمثلة الكود المتاحة. بمجرد حصولك على المعرف والسر الخاصين بك ، أضف الرمز كما هو موضح أدناه:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

استخراج صفحات معينة من PDF باستخدام REST API في Python

يمكنك استخراج صفحات معينة من مستندات PDF باتباع الخطوات البسيطة المذكورة أدناه:

  1. تحميل ملف PDF على السحابة
  2. استخراج صفحات محددة بأرقام الصفحات من ملف PDF الذي تم تحميله
  3. تنزيل الملف (الملفات) المستخرجة

قم بتحميل المستند

بادئ ذي بدء ، قم بتحميل مستند PDF متعدد الصفحات إلى السحابة باستخدام مثال الرمز الموضح أدناه:

# إنشاء مثيل لواجهة برمجة التطبيقات
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# تحميل ملفات عينة
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)

نتيجة لذلك ، سيتم تحميل ملف PDF إلى Cloud Storage وسيكون متاحًا في قسم الملفات من لوحة المعلومات الخاصة بك.

استخراج صفحات معينة من خلال أرقام الصفحات باستخدام Python

يرجى اتباع الخطوات المذكورة أدناه لاستخراج صفحة معينة أو صفحات متعددة من مستند PDF برمجيًا.

  • قم بإنشاء مثيل Document API
  • توفير SplitOptions
  • قم بتعيين مسار ملف الإدخال
  • قم بتعيين مسار دليل الإخراج
  • قم بتوفير أرقام الصفحات مفصولة بفواصل لاستخراجها
  • اضبط الوضع على الصفحات
  • إنشاء SplitRequest
  • احصل على النتائج عن طريق استدعاء الأسلوب DocumentApi.split()

يوضح مثال الكود التالي كيفية استخراج الصفحات من خلال توفير أرقام صفحات معينة من مستند PDF باستخدام واجهة برمجة تطبيقات REST.

# تهيئة API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# تحديد خيارات الانقسام
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"

# إنشاء طلب الانقسام
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)        

print("Documents count = " + str(len(result.documents)))
استخراج صفحات معينة من PDF باستخدام Python

استخراج صفحات معينة من PDF باستخدام Python

قم بتنزيل ملفات الصفحة المستخرجة

سيحفظ نموذج الكود أعلاه الصفحات المستخرجة في ملفات PDF منفصلة على السحابة. يمكنك تنزيلها باستخدام نموذج التعليمات البرمجية التالي:

# تهيئة API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# طلب تحميل الملف
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)

# انقل الملف الذي تم تنزيله إلى دليل العمل الخاص بك
shutil.move(response, "C:\\Files\\")

استخراج الصفحات حسب نطاق الصفحات باستخدام Python

يرجى اتباع الخطوات المذكورة أدناه لاستخراج الصفحات من مستند PDF من خلال توفير نطاق صفحات برمجيًا.

  • قم بإنشاء مثيل Document API
  • توفير SplitOptions
  • قم بتعيين مسار ملف الإدخال
  • قم بتعيين مسار دليل الإخراج
  • قم بتوفير نطاق الصفحات عن طريق تعيين رقم صفحة البداية ورقم صفحة النهاية لاستخراجها
  • اضبط الوضع على الصفحات
  • إنشاء SplitRequest
  • احصل على النتائج عن طريق استدعاء الأسلوب DocumentApi.split()
  • قم بإنشاء DownloadFileRequest
  • قم بتنزيل الملف عن طريق استدعاء الأسلوب FileApi.download \ file()

يوضح مثال الكود التالي كيفية استخراج الصفحات من خلال توفير نطاق صفحات من مستند PDF باستخدام واجهة برمجة تطبيقات REST. يرجى اتباع الخطوات المذكورة سابقاً لتحميل الملفات.

# تهيئة API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# تحديد خيارات الانقسام
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"

# إنشاء طلب الانقسام
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)   

print("Documents count = " + str(len(result.documents)))

# عرض النتائج وتنزيل الملفات واحدًا تلو الآخر
for data in result.documents:
    print("Document Url = " + str(data))
    
    # طلب إنشاء ملف تنزيل
    request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
    response = file_api.download_file(request)
    
    # انقل الملف الذي تم تنزيله إلى دليل العمل الخاص بك
    shutil.move(response, "C:\\Files\\")
استخراج الصفحات حسب نطاق الصفحات باستخدام Python

استخراج الصفحات حسب نطاق الصفحات باستخدام Python

جرب عبر الإنترنت

يرجى تجربة أداة تقسيم PDF المجانية التالية عبر الإنترنت ، والتي تم تطويرها باستخدام واجهة برمجة التطبيقات المذكورة أعلاه. https://products.groupdocs.app/splitter/pdf

خاتمة

في هذه المقالة ، تعلمت كيفية استخراج صفحات معينة من مستندات PDF على السحابة باستخدام Python. لقد تعلمت أيضًا كيفية تحميل ملف PDF برمجيًا على السحابة ثم تنزيل الملفات المستخرجة من السحابة. يمكنك معرفة المزيد حول GroupDocs.Merger Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. في حالة وجود أي غموض ، فلا تتردد في الاتصال بنا على المنتدى.

أنظر أيضا