استخراج صفحات خاص از PDF

ممکن است لازم باشد صفحات خاصی را از اسناد PDF استخراج کنید یا ممکن است لازم باشد اسناد PDF بزرگ را به قسمت های کوچکتر تقسیم کنید. به‌عنوان یک توسعه‌دهنده پایتون، می‌توانید به‌راحتی صفحات خاصی را از اسناد PDF با شماره صفحه یا با طیف وسیعی از صفحات به‌صورت برنامه‌نویسی استخراج کنید. در این مقاله، نحوه استخراج صفحات خاص از اسناد PDF با استفاده از REST API در پایتون را خواهید آموخت.

موضوعات زیر در این مقاله پوشش داده خواهد شد:

Document Splitter REST API و Python SDK

برای استخراج صفحات از اسناد PDF، از Python SDK of GroupDocs.Merger Cloud API استفاده خواهم کرد. این یک Cloud SDK با ویژگی های غنی و با کارایی بالا است که برای ادغام چندین سند در یک سند واحد استفاده می شود. همچنین به شما امکان می دهد یک سند واحد را به چندین سند تقسیم کنید. SDK عملکردی را برای حذف، مبادله، چرخش یا تغییر جهت صفحه برای کل یا محدوده ترجیحی صفحات و انجام دستکاری های دیگر برای هر فرمت فایل پشتیبانی شده مانند صفحات PDF، Word، Powerpoint و Excel ارائه می دهد. در حال حاضر، SDK های .NET، جاوا، PHP، Ruby، Android و Node.js را به عنوان [اعضای خانواده ادغام اسناد3 خود برای Cloud API ارائه می کند.

می‌توانید GroupDocs.Merger-Cloud را در پروژه پایتون خود با استفاده از دستور زیر در کنسول نصب کنید:

pip install groupdocs_merger_cloud

لطفاً قبل از شروع به دنبال کردن مراحل و نمونه‌های کد موجود، شناسه مشتری و راز مشتری خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کدی را که در زیر نشان داده شده است اضافه کنید:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

استخراج صفحات خاص از PDF با استفاده از REST API در پایتون

با دنبال کردن مراحل ساده زیر می توانید صفحات خاصی را از اسناد PDF استخراج کنید:

  1. آپلود فایل PDF در Cloud
  2. [صفحات خاص را بر اساس شماره صفحات 6 از فایل PDF آپلود شده استخراج کنید
  3. دانلود فایل(های) استخراج شده

سند را آپلود کنید

اول از همه، سند PDF چند صفحه ای را با استفاده از مثال کد زیر در Cloud آپلود کنید:

# ایجاد نمونه ای از API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# فایل های نمونه را آپلود کنید
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)

در نتیجه، فایل PDF در فضای ذخیره‌سازی ابری آپلود می‌شود و در بخش فایل‌ها داشبورد شما در دسترس خواهد بود.

استخراج صفحات خاص بر اساس شماره صفحات با استفاده از پایتون

لطفاً مراحل ذکر شده در زیر را دنبال کنید تا یک صفحه خاص یا چندین صفحه را از یک سند PDF به صورت برنامه ریزی شده استخراج کنید.

  • یک نمونه Document API ایجاد کنید
  • SplitOptions را ارائه دهید
  • مسیر فایل ورودی را تنظیم کنید
  • مسیر دایرکتوری Output را تنظیم کنید
  • اعداد صفحه جدا شده با کاما را برای استخراج ارائه دهید
  • حالت را روی Pages تنظیم کنید
  • SplitRequest ایجاد کنید
  • با فراخوانی روش DocumentApi.split() به نتایج برسید

مثال کد زیر نحوه استخراج صفحات را با ارائه شماره صفحات خاص از یک سند PDF با استفاده از REST API نشان می دهد.

# مقداردهی اولیه api
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# گزینه های تقسیم را تعریف کنید
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"

# ایجاد درخواست تقسیم
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)        

print("Documents count = " + str(len(result.documents)))
استخراج صفحات خاص از PDF با استفاده از پایتون

استخراج صفحات خاص از PDF با استفاده از پایتون

فایل های صفحه استخراج شده را دانلود کنید

نمونه کد بالا صفحات استخراج شده را در فایل های PDF جداگانه در فضای ابری ذخیره می کند. با استفاده از نمونه کد زیر می توانید آنها را دانلود کنید:

# مقداردهی اولیه api
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# درخواست دانلود فایل
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)

# فایل دانلود شده را به دایرکتوری کاری خود منتقل کنید
shutil.move(response, "C:\\Files\\")

استخراج صفحات بر اساس محدوده صفحه با استفاده از پایتون

لطفاً مراحل ذکر شده در زیر را برای استخراج صفحات از یک سند PDF با ارائه یک محدوده صفحه به صورت برنامه ای دنبال کنید.

  • یک نمونه Document API ایجاد کنید
  • SplitOptions را ارائه دهید
  • مسیر فایل ورودی را تنظیم کنید
  • مسیر دایرکتوری Output را تنظیم کنید
  • محدوده صفحه را با تنظیم شماره صفحه شروع و شماره صفحه پایان برای استخراج ارائه دهید
  • حالت را روی Pages تنظیم کنید
  • SplitRequest ایجاد کنید
  • با فراخوانی روش DocumentApi.split() به نتیجه برسید
  • DownloadFileRequest را ایجاد کنید
  • با فراخوانی روش FileApi.download\file() فایل را دانلود کنید

مثال کد زیر نحوه استخراج صفحات را با ارائه محدوده صفحه از یک سند PDF با استفاده از REST API نشان می دهد. لطفاً برای آپلود فایل ها مراحل ذکر شده قبلی را دنبال کنید.

# مقداردهی اولیه api
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# گزینه های تقسیم را تعریف کنید
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"

# ایجاد درخواست تقسیم
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)   

print("Documents count = " + str(len(result.documents)))

# نمایش نتایج و دانلود فایل ها یکی یکی
for data in result.documents:
    print("Document Url = " + str(data))
    
    # ایجاد درخواست دانلود فایل
    request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
    response = file_api.download_file(request)
    
    # فایل دانلود شده را به دایرکتوری کاری خود منتقل کنید
    shutil.move(response, "C:\\Files\\")
استخراج صفحات بر اساس محدوده صفحه با استفاده از پایتون

استخراج صفحات بر اساس محدوده صفحه با استفاده از پایتون

آنلاین را امتحان کنید

لطفاً ابزار رایگان آنلاین PDF splitter زیر را که با استفاده از API بالا ایجاد شده است، امتحان کنید. https://products.groupdocs.app/splitter/pdf

نتیجه

در این مقاله، نحوه استخراج صفحات خاص از اسناد PDF در فضای ابری با استفاده از پایتون را آموختید. همچنین یاد گرفتید که چگونه فایل پی دی اف را به صورت برنامه نویسی در فضای ابری آپلود کنید و سپس فایل های استخراج شده را از ابر دانلود کنید. می‌توانید با استفاده از مستندات درباره GroupDocs.Merger Cloud API بیشتر بیاموزید. ما همچنین یک بخش API Reference ارائه می‌کنیم که به شما امکان می‌دهد APIهای ما را مستقیماً از طریق مرورگر تجسم کرده و با آن‌ها تعامل داشته باشید. در صورت وجود هرگونه ابهام، لطفاً با ما در تالار گفتمان تماس بگیرید.

همچنین ببینید