در موارد خاص، ممکن است لازم باشد صفحات PDF را از اسناد PDF استخراج کنید یا ممکن است لازم باشد اسناد PDF بزرگ را به فایل های PDF کوچکتر جدا کنید. بهعنوان یک توسعهدهنده پایتون، میتوانید به راحتی صفحات خاصی را از فایلهای PDF بهصورت آنلاین استخراج کنید یا صفحات PDF را بر اساس محدوده صفحه بهصورت برنامهنویسی استخراج کنید. در این مقاله نحوه استخراج صفحات از فایل PDF به صورت آنلاین در پایتون با استفاده از REST API را خواهید آموخت.
در این مقاله به موضوعات زیر پرداخته خواهد شد:
- Document Extractor REST API و Python SDK
- نحوه استخراج صفحات خاص از PDF در پایتون با استفاده از REST API
- استخراج صفحات از PDF با استفاده از محدوده صفحه در پایتون با استفاده از REST API
Document Extractor REST API و Python SDK
به منظور استخراج صفحات PDF از فایل های PDF به صورت آنلاین، از Python SDK از GroupDocs.Merger Cloud API استفاده خواهم کرد. این یک Cloud SDK با ویژگی های غنی و با کارایی بالا است. این API پایتون شما را قادر می سازد صفحات PDF را از یک سند واحد به چندین فایل استخراج کنید. SDK عملکردی برای تنظیم مجدد، حذف، مبادله، چرخش یا تغییر جهت صفحه برای کل یا محدوده ترجیحی صفحات ارائه می دهد. همچنین از دستکاریهای دیگر برای هر فرمت فایل پشتیبانیشده مانند PDF، Word، PowerPoint، کاربرگهای Excel و غیره پشتیبانی میکند. در حال حاضر، از SDK.NET، Java، PHP، Ruby، Android و Node.js به عنوان سند [ادغام] پشتیبانی میکند. 5] اعضای خانواده برای Cloud API.
می توانید GroupDocs.Merger-Cloud را در پروژه پایتون خود با استفاده از دستور زیر در کنسول نصب کنید:
pip install groupdocs_merger_cloud
لطفاً قبل از شروع به دنبال کردن مراحل و نمونههای کد موجود، شناسه مشتری و راز مشتری خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کدی را که در زیر نشان داده شده است اضافه کنید:
# SDK ادغام groupdocs را وارد کنید
import groupdocs_merger_cloud
# پس از ثبت نام رایگان، app_sid و app_key را از https://dashboard.groupdocs.cloud دریافت کنید.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# پیکربندی های File API را دریافت کنید
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
نحوه استخراج صفحات خاص از PDF در پایتون با استفاده از REST API
API تقسیمکننده PDF ما به شما امکان میدهد پیشنمایش صفحاتی را که میخواهید تقسیم کنید، مشاهده کنید. شما می توانید صفحات را تنها با ارائه تعداد صفحاتی که می خواهید استخراج کنید انتخاب کنید. فورا PDF خود را به صفحات جداگانه تقسیم کنید یا صفحات خاصی را از یک سند PDF جدید استخراج کنید. با دنبال کردن مراحل ساده زیر، صفحات PDF را از فایلهای PDF استخراج کنید:
- آپلود فایل PDF در Cloud.
- Extract صفحات PDF بر اساس شماره صفحات در پایتون.
- دانلود فایل های استخراج شده.
سند را آپلود کنید
اول از همه، سند PDF چند صفحه ای را با استفاده از قطعه کد زیر در Cloud آپلود کنید:
# فایل PDF را در فضای ذخیره سازی ابری آپلود کنید
# یک نمونه از API فایل ایجاد کنید
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# تماس درخواست آپلود فایل
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)
# فایل PDF را در فضای ابری بارگذاری کنید
response = file_api.upload_file(request)
print(response.uploaded)
در نتیجه، فایل PDF در فضای ذخیرهسازی ابری آپلود میشود و در بخش فایلها داشبورد شما در دسترس خواهد بود. ما تمام فایلهای شما را 24 ساعت پس از آپلود برای همیشه از ابر حذف میکنیم.
استخراج صفحات خاص بر اساس شماره صفحات با استفاده از پایتون
برای استخراج یک صفحه خاص یا چندین صفحه از یک سند PDF به صورت برنامه ریزی شده، مراحل ذکر شده در زیر را دنبال کنید:
- ابتدا یک نمونه PagesApi ایجاد کنید
- در مرحله دوم، نمونه ExtractOptions را ارائه دهید
- اکنون مسیر فایل ورودی را با نمونه FileInfo تنظیم کنید
- سپس مسیر دایرکتوری Output را تنظیم کنید
- سپس، اعداد صفحات جدا شده با کاما را برای استخراج ارائه دهید
- سپس حالت را روی Pages قرار دهید
- بعد، نمونه ExtractRequest را ایجاد کنید
- در نهایت، با فراخوانی کلاس pagesApi.extract() نتیجه بگیرید
مثال کد زیر نحوه استخراج صفحات را با ارائه شماره صفحات خاص از سند PDF با استفاده از REST API نشان می دهد:
# نحوه استخراج صفحات خاص از PDF در پایتون با استفاده از REST API
try:
# یک نمونه از صفحات API ایجاد کنید
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
options.output_path = "python-testing"
options.pages = [2, 4, 7]
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
فایل صفحات PDF استخراج شده را دانلود کنید
نمونه کد بالا صفحات استخراج شده را در فایل های PDF جداگانه در فضای ابری ذخیره می کند. با استفاده از نمونه کد زیر می توانید آنها را دانلود کنید:
# مقداردهی اولیه API برای دانلود فایل تبدیل شده
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# درخواست فایل دانلود را ایجاد کنید
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)
# دانلود فایل تبدیل شده
response = file_api.download_file(request)
# فایل دانلود شده را به دایرکتوری خود منتقل کنید
shutil.move(response, "H:\\groupdocs-cloud-data\\")
با استفاده از REST API، صفحات را از PDF با محدوده صفحه در پایتون استخراج کنید
لطفاً مراحل ذکر شده در زیر را برای استخراج صفحات از یک سند PDF با ارائه یک محدوده صفحه به صورت برنامه ای دنبال کنید.
- ابتدا یک نمونه PagesApi ایجاد کنید
- سپس ExtractOptions را تنظیم کنید
- مسیر فایل ورودی را با نمونه FileInfo تنظیم کنید
- سپس مسیر دایرکتوری Output را تنظیم کنید
- با تنظیم شماره صفحه شروع و شماره صفحه پایان برای استخراج، یک محدوده صفحه ارائه دهید
- اکنون فاصله حالت را روی Pages تنظیم کنید
- محدوده حالت را روی EvenPages یا OddPages قرار دهید
- بعد، نمونه ExtractRequest را ایجاد کنید
- در نهایت با فراخوانی متد pagesApi.extract() به نتیجه برسید
مثال کد زیر نحوه استخراج صفحات را با ارائه محدوده صفحه از سند PDF با استفاده از REST API نشان می دهد. لطفاً برای آپلود فایل ها مراحل ذکر شده را دنبال کنید.
# نحوه استخراج صفحات از PDF با استفاده از محدوده صفحه در پایتون با استفاده از REST API
try:
# یک نمونه از Document API ایجاد کنید
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
options.output_path = "python-testing"
options.start_page_number = 1
options.end_page_number = 10
options.range_mode = "EvenPages" # or set range_mode to "OddPages"
options.mode = "Pages" # Mode Intervals
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
PDF استخراج صفحه رایگان
چگونه صفحات را از pdf به صورت رایگان استخراج کنیم؟ لطفاً [ابزار استخراج آنلاین رایگان PDF] زیر را امتحان کنید، که با استفاده از API فوق توسعه یافته است.
جمع بندی
این ما را به نتیجه ای از پست وبلاگ می رساند. امیدوارم یاد گرفته باشید:
- نحوه استخراج صفحات خاص از اسناد PDF در پایتون.
- فایل PDF را به صورت برنامهریزی آپلود کنید و سپس فایلهای استخراج شده را از ابر دانلود کنید.
- نحوه استخراج صفحات فایل PDF با استفاده از محدوده صفحه با استفاده از پایتون.
با استفاده از مستندات میتوانید درباره GroupDocs.Merger Cloud API بیشتر بیاموزید. ما همچنین یک بخش API Reference ارائه میکنیم که به شما امکان میدهد APIهای ما را مستقیماً از طریق مرورگر تجسم کنید و با آنها تعامل داشته باشید.
در صفحه شروع، ما ممکن است جزئیات بیشتری را کشف کنید.
علاوه بر این، Groupdocs.cloud به طور مداوم با موضوعات جدید به روز می شود. در نتیجه، در مورد جدیدترین اطلاعات APIها به روز بمانید.
یه سوال بپرس
میتوانید سؤالات خود را درباره API نرمافزار استخراج صفحه PDF، از طریق پشتیبانی رایگان [فوروم] ما بپرسید (https://forum.groupdocs.cloud/c/conversion/11)
سوالات متداول
چگونه صفحات را از فایل PDF در پایتون استخراج کنیم؟
لطفاً این پیوند را دنبال کنید تا قطعه کد پایتون را در مورد نحوه استخراج صفحات از فایلهای PDF در پایتون بیاموزید.
چگونه با استفاده از REST API صفحات را از اسناد PDF به صورت آنلاین استخراج کنیم؟
یک نمونه از PagesApi ایجاد کنید، مقادیر ExtractOptions را تنظیم کنید و برای ذخیره صفحات انتخابی فایل PDF به صورت آنلاین، متد pagesApi.extract() را با ExtractRequest فراخوانی کنید.
چگونه یک کتابخانه دانلود رایگان استخراج کننده صفحه PDF را نصب کنیم؟
یک راه آسان برای استخراج صفحات از PDF استفاده از Python SDK است. می توانید کتابخانه Python استخراج کننده PDF را برای استخراج چندین صفحه از فایل های PDF به صورت برنامه ریزی شده نصب کنید.
چگونه صفحات PDF را به صورت آفلاین در ویندوز استخراج کنم؟
لطفاً برای دانلود نرم افزار استخراج PDF برای ویندوز، به این پیوند مراجعه کنید. این نرم افزار دانلود رایگان استخراج کننده PDF صفحات PDF را به سرعت و با یک کلیک در ویندوز تقسیم می کند.
همچنین ببینید
- استخراج متن از PDF با استفاده از پایتون
- ادغام پاورپوینت PPT/PPTX فایل های آنلاین با استفاده از REST API در Ruby
- استخراج داده های خاص از PDF با استفاده از پایتون
- CSV را به JSON و JSON را به CSV در پایتون تبدیل کنید
- ادغام فایل های PDF با استفاده از REST API
- تبدیل SVG به PNG با کیفیت بالا در پایتون
- CSV را به JSON و JSON را به CSV در پایتون تبدیل کنید
- نحوه تبدیل PDF به Excel در پایتون با استفاده از REST API