چگونه صفحات را از فایل PDF بصورت آنلاین در پایتون استخراج کنیم

استخراج صفحات از فایل PDF آنلاین در پایتون

در موارد خاص، ممکن است لازم باشد صفحات PDF را از اسناد PDF استخراج کنید یا ممکن است لازم باشد اسناد PDF بزرگ را به فایل های PDF کوچکتر جدا کنید. به‌عنوان یک توسعه‌دهنده پایتون، می‌توانید به راحتی صفحات خاصی را از فایل‌های PDF به‌صورت آنلاین استخراج کنید یا صفحات PDF را بر اساس محدوده صفحه به‌صورت برنامه‌نویسی استخراج کنید. در این مقاله نحوه استخراج صفحات از فایل PDF به صورت آنلاین در پایتون با استفاده از REST API را خواهید آموخت.

در این مقاله به موضوعات زیر پرداخته خواهد شد:

Document Extractor REST API و Python SDK

به منظور استخراج صفحات PDF از فایل های PDF به صورت آنلاین، از Python SDK از GroupDocs.Merger Cloud API استفاده خواهم کرد. این یک Cloud SDK با ویژگی های غنی و با کارایی بالا است. این API پایتون شما را قادر می سازد صفحات PDF را از یک سند واحد به چندین فایل استخراج کنید. SDK عملکردی برای تنظیم مجدد، حذف، مبادله، چرخش یا تغییر جهت صفحه برای کل یا محدوده ترجیحی صفحات ارائه می دهد. همچنین از دستکاری‌های دیگر برای هر فرمت فایل پشتیبانی‌شده مانند PDF، Word، PowerPoint، کاربرگ‌های Excel و غیره پشتیبانی می‌کند. در حال حاضر، از SDK.NET، Java، PHP، Ruby، Android و Node.js به عنوان سند [ادغام] پشتیبانی می‌کند. 5] اعضای خانواده برای Cloud API.

می توانید GroupDocs.Merger-Cloud را در پروژه پایتون خود با استفاده از دستور زیر در کنسول نصب کنید:

pip install groupdocs_merger_cloud

لطفاً قبل از شروع به دنبال کردن مراحل و نمونه‌های کد موجود، شناسه مشتری و راز مشتری خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کدی را که در زیر نشان داده شده است اضافه کنید:

# SDK ادغام groupdocs را وارد کنید
import groupdocs_merger_cloud

# پس از ثبت نام رایگان، app_sid و app_key را از https://dashboard.groupdocs.cloud دریافت کنید.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# پیکربندی های File API را دریافت کنید 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

نحوه استخراج صفحات خاص از PDF در پایتون با استفاده از REST API

API تقسیم‌کننده PDF ما به شما امکان می‌دهد پیش‌نمایش صفحاتی را که می‌خواهید تقسیم کنید، مشاهده کنید. شما می توانید صفحات را تنها با ارائه تعداد صفحاتی که می خواهید استخراج کنید انتخاب کنید. فورا PDF خود را به صفحات جداگانه تقسیم کنید یا صفحات خاصی را از یک سند PDF جدید استخراج کنید. با دنبال کردن مراحل ساده زیر، صفحات PDF را از فایل‌های PDF استخراج کنید:

  1. آپلود فایل PDF در Cloud.
  2. Extract صفحات PDF بر اساس شماره صفحات در پایتون.
  3. دانلود فایل های استخراج شده.

سند را آپلود کنید

اول از همه، سند PDF چند صفحه ای را با استفاده از قطعه کد زیر در Cloud آپلود کنید:

# فایل PDF را در فضای ذخیره سازی ابری آپلود کنید
# یک نمونه از API فایل ایجاد کنید
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# تماس درخواست آپلود فایل
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)

# فایل PDF را در فضای ابری بارگذاری کنید
response = file_api.upload_file(request)
print(response.uploaded)

در نتیجه، فایل PDF در فضای ذخیره‌سازی ابری آپلود می‌شود و در بخش فایل‌ها داشبورد شما در دسترس خواهد بود. ما تمام فایل‌های شما را 24 ساعت پس از آپلود برای همیشه از ابر حذف می‌کنیم.

استخراج صفحات خاص بر اساس شماره صفحات با استفاده از پایتون

برای استخراج یک صفحه خاص یا چندین صفحه از یک سند PDF به صورت برنامه ریزی شده، مراحل ذکر شده در زیر را دنبال کنید:

  • ابتدا یک نمونه PagesApi ایجاد کنید
  • در مرحله دوم، نمونه ExtractOptions را ارائه دهید
  • اکنون مسیر فایل ورودی را با نمونه FileInfo تنظیم کنید
  • سپس مسیر دایرکتوری Output را تنظیم کنید
  • سپس، اعداد صفحات جدا شده با کاما را برای استخراج ارائه دهید
  • سپس حالت را روی Pages قرار دهید
  • بعد، نمونه ExtractRequest را ایجاد کنید
  • در نهایت، با فراخوانی کلاس pagesApi.extract() نتیجه بگیرید

مثال کد زیر نحوه استخراج صفحات را با ارائه شماره صفحات خاص از سند PDF با استفاده از REST API نشان می دهد:

# نحوه استخراج صفحات خاص از PDF در پایتون با استفاده از REST API
try:
    # یک نمونه از صفحات API ایجاد کنید
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
    options.output_path = "python-testing"
    options.pages = [2, 4, 7]        
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

فایل صفحات PDF استخراج شده را دانلود کنید

نمونه کد بالا صفحات استخراج شده را در فایل های PDF جداگانه در فضای ابری ذخیره می کند. با استفاده از نمونه کد زیر می توانید آنها را دانلود کنید:

# مقداردهی اولیه API برای دانلود فایل تبدیل شده
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# درخواست فایل دانلود را ایجاد کنید
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)

# دانلود فایل تبدیل شده
response = file_api.download_file(request)

# فایل دانلود شده را به دایرکتوری خود منتقل کنید
shutil.move(response, "H:\\groupdocs-cloud-data\\")

با استفاده از REST API، صفحات را از PDF با محدوده صفحه در پایتون استخراج کنید

لطفاً مراحل ذکر شده در زیر را برای استخراج صفحات از یک سند PDF با ارائه یک محدوده صفحه به صورت برنامه ای دنبال کنید.

  • ابتدا یک نمونه PagesApi ایجاد کنید
  • سپس ExtractOptions را تنظیم کنید
  • مسیر فایل ورودی را با نمونه FileInfo تنظیم کنید
  • سپس مسیر دایرکتوری Output را تنظیم کنید
  • با تنظیم شماره صفحه شروع و شماره صفحه پایان برای استخراج، یک محدوده صفحه ارائه دهید
  • اکنون فاصله حالت را روی Pages تنظیم کنید
  • محدوده حالت را روی EvenPages یا OddPages قرار دهید
  • بعد، نمونه ExtractRequest را ایجاد کنید
  • در نهایت با فراخوانی متد pagesApi.extract() به نتیجه برسید

مثال کد زیر نحوه استخراج صفحات را با ارائه محدوده صفحه از سند PDF با استفاده از REST API نشان می دهد. لطفاً برای آپلود فایل ها مراحل ذکر شده را دنبال کنید.

# نحوه استخراج صفحات از PDF با استفاده از محدوده صفحه در پایتون با استفاده از REST API
try:
    # یک نمونه از Document API ایجاد کنید
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
    options.output_path = "python-testing"
    options.start_page_number = 1
    options.end_page_number = 10
    options.range_mode = "EvenPages" # or set range_mode to "OddPages"
    options.mode = "Pages" # Mode Intervals
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

PDF استخراج صفحه رایگان

چگونه صفحات را از pdf به صورت رایگان استخراج کنیم؟ لطفاً [ابزار استخراج آنلاین رایگان PDF] زیر را امتحان کنید، که با استفاده از API فوق توسعه یافته است.

جمع بندی

این ما را به نتیجه ای از پست وبلاگ می رساند. امیدوارم یاد گرفته باشید:

  • نحوه استخراج صفحات خاص از اسناد PDF در پایتون.
  • فایل PDF را به صورت برنامه‌ریزی آپلود کنید و سپس فایل‌های استخراج شده را از ابر دانلود کنید.
  • نحوه استخراج صفحات فایل PDF با استفاده از محدوده صفحه با استفاده از پایتون.

با استفاده از مستندات می‌توانید درباره GroupDocs.Merger Cloud API بیشتر بیاموزید. ما همچنین یک بخش API Reference ارائه می‌کنیم که به شما امکان می‌دهد API‌های ما را مستقیماً از طریق مرورگر تجسم کنید و با آن‌ها تعامل داشته باشید.

در صفحه شروع، ما ممکن است جزئیات بیشتری را کشف کنید.

علاوه بر این، Groupdocs.cloud به طور مداوم با موضوعات جدید به روز می شود. در نتیجه، در مورد جدیدترین اطلاعات APIها به روز بمانید.

یه سوال بپرس

می‌توانید سؤالات خود را درباره API نرم‌افزار استخراج صفحه PDF، از طریق پشتیبانی رایگان [فوروم] ما بپرسید (https://forum.groupdocs.cloud/c/conversion/11)

سوالات متداول

چگونه صفحات را از فایل PDF در پایتون استخراج کنیم؟

لطفاً این پیوند را دنبال کنید تا قطعه کد پایتون را در مورد نحوه استخراج صفحات از فایل‌های PDF در پایتون بیاموزید.

چگونه با استفاده از REST API صفحات را از اسناد PDF به صورت آنلاین استخراج کنیم؟

یک نمونه از PagesApi ایجاد کنید، مقادیر ExtractOptions را تنظیم کنید و برای ذخیره صفحات انتخابی فایل PDF به صورت آنلاین، متد pagesApi.extract() را با ExtractRequest فراخوانی کنید.

چگونه یک کتابخانه دانلود رایگان استخراج کننده صفحه PDF را نصب کنیم؟

یک راه آسان برای استخراج صفحات از PDF استفاده از Python SDK است. می توانید کتابخانه Python استخراج کننده PDF را برای استخراج چندین صفحه از فایل های PDF به صورت برنامه ریزی شده نصب کنید.

چگونه صفحات PDF را به صورت آفلاین در ویندوز استخراج کنم؟

لطفاً برای دانلود نرم افزار استخراج PDF برای ویندوز، به این پیوند مراجعه کنید. این نرم افزار دانلود رایگان استخراج کننده PDF صفحات PDF را به سرعت و با یک کلیک در ویندوز تقسیم می کند.

همچنین ببینید