ممکن است لازم باشد صفحات خاصی را از اسناد PDF استخراج کنید یا ممکن است لازم باشد اسناد PDF بزرگ را به قسمت های کوچکتر تقسیم کنید. بهعنوان یک توسعهدهنده پایتون، میتوانید بهراحتی صفحات خاصی را از اسناد PDF با شماره صفحه یا با طیف وسیعی از صفحات بهصورت برنامهنویسی استخراج کنید. در این مقاله، نحوه استخراج صفحات خاص از اسناد PDF با استفاده از REST API در پایتون را خواهید آموخت.
موضوعات زیر در این مقاله پوشش داده خواهد شد:
- Document Splitter REST API و Python SDK
- با استفاده از REST API صفحات خاصی را از PDF استخراج کنید
- استخراج صفحات بر اساس محدوده صفحه با استفاده از پایتون
Document Splitter REST API و Python SDK
برای استخراج صفحات از اسناد PDF، از Python SDK of GroupDocs.Merger Cloud API استفاده خواهم کرد. این یک Cloud SDK با ویژگی های غنی و با کارایی بالا است که برای ادغام چندین سند در یک سند واحد استفاده می شود. همچنین به شما امکان می دهد یک سند واحد را به چندین سند تقسیم کنید. SDK عملکردی را برای حذف، مبادله، چرخش یا تغییر جهت صفحه برای کل یا محدوده ترجیحی صفحات و انجام دستکاری های دیگر برای هر فرمت فایل پشتیبانی شده مانند صفحات PDF، Word، Powerpoint و Excel ارائه می دهد. در حال حاضر، SDK های .NET، جاوا، PHP، Ruby، Android و Node.js را به عنوان [اعضای خانواده ادغام اسناد3 خود برای Cloud API ارائه می کند.
میتوانید GroupDocs.Merger-Cloud را در پروژه پایتون خود با استفاده از دستور زیر در کنسول نصب کنید:
pip install groupdocs_merger_cloud
لطفاً قبل از شروع به دنبال کردن مراحل و نمونههای کد موجود، شناسه مشتری و راز مشتری خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کدی را که در زیر نشان داده شده است اضافه کنید:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
استخراج صفحات خاص از PDF با استفاده از REST API در پایتون
با دنبال کردن مراحل ساده زیر می توانید صفحات خاصی را از اسناد PDF استخراج کنید:
- آپلود فایل PDF در Cloud
- [صفحات خاص را بر اساس شماره صفحات 6 از فایل PDF آپلود شده استخراج کنید
- دانلود فایل(های) استخراج شده
سند را آپلود کنید
اول از همه، سند PDF چند صفحه ای را با استفاده از مثال کد زیر در Cloud آپلود کنید:
# ایجاد نمونه ای از API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# فایل های نمونه را آپلود کنید
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)
در نتیجه، فایل PDF در فضای ذخیرهسازی ابری آپلود میشود و در بخش فایلها داشبورد شما در دسترس خواهد بود.
استخراج صفحات خاص بر اساس شماره صفحات با استفاده از پایتون
لطفاً مراحل ذکر شده در زیر را دنبال کنید تا یک صفحه خاص یا چندین صفحه را از یک سند PDF به صورت برنامه ریزی شده استخراج کنید.
- یک نمونه Document API ایجاد کنید
- SplitOptions را ارائه دهید
- مسیر فایل ورودی را تنظیم کنید
- مسیر دایرکتوری Output را تنظیم کنید
- اعداد صفحه جدا شده با کاما را برای استخراج ارائه دهید
- حالت را روی Pages تنظیم کنید
- SplitRequest ایجاد کنید
- با فراخوانی روش DocumentApi.split() به نتایج برسید
مثال کد زیر نحوه استخراج صفحات را با ارائه شماره صفحات خاص از یک سند PDF با استفاده از REST API نشان می دهد.
# مقداردهی اولیه api
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
# گزینه های تقسیم را تعریف کنید
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"
# ایجاد درخواست تقسیم
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
فایل های صفحه استخراج شده را دانلود کنید
نمونه کد بالا صفحات استخراج شده را در فایل های PDF جداگانه در فضای ابری ذخیره می کند. با استفاده از نمونه کد زیر می توانید آنها را دانلود کنید:
# مقداردهی اولیه api
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# درخواست دانلود فایل
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)
# فایل دانلود شده را به دایرکتوری کاری خود منتقل کنید
shutil.move(response, "C:\\Files\\")
استخراج صفحات بر اساس محدوده صفحه با استفاده از پایتون
لطفاً مراحل ذکر شده در زیر را برای استخراج صفحات از یک سند PDF با ارائه یک محدوده صفحه به صورت برنامه ای دنبال کنید.
- یک نمونه Document API ایجاد کنید
- SplitOptions را ارائه دهید
- مسیر فایل ورودی را تنظیم کنید
- مسیر دایرکتوری Output را تنظیم کنید
- محدوده صفحه را با تنظیم شماره صفحه شروع و شماره صفحه پایان برای استخراج ارائه دهید
- حالت را روی Pages تنظیم کنید
- SplitRequest ایجاد کنید
- با فراخوانی روش DocumentApi.split() به نتیجه برسید
- DownloadFileRequest را ایجاد کنید
- با فراخوانی روش FileApi.download\file() فایل را دانلود کنید
مثال کد زیر نحوه استخراج صفحات را با ارائه محدوده صفحه از یک سند PDF با استفاده از REST API نشان می دهد. لطفاً برای آپلود فایل ها مراحل ذکر شده قبلی را دنبال کنید.
# مقداردهی اولیه api
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# گزینه های تقسیم را تعریف کنید
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"
# ایجاد درخواست تقسیم
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
# نمایش نتایج و دانلود فایل ها یکی یکی
for data in result.documents:
print("Document Url = " + str(data))
# ایجاد درخواست دانلود فایل
request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
response = file_api.download_file(request)
# فایل دانلود شده را به دایرکتوری کاری خود منتقل کنید
shutil.move(response, "C:\\Files\\")
آنلاین را امتحان کنید
لطفاً ابزار رایگان آنلاین PDF splitter زیر را که با استفاده از API بالا ایجاد شده است، امتحان کنید. https://products.groupdocs.app/splitter/pdf
نتیجه
در این مقاله، نحوه استخراج صفحات خاص از اسناد PDF در فضای ابری با استفاده از پایتون را آموختید. همچنین یاد گرفتید که چگونه فایل پی دی اف را به صورت برنامه نویسی در فضای ابری آپلود کنید و سپس فایل های استخراج شده را از ابر دانلود کنید. میتوانید با استفاده از مستندات درباره GroupDocs.Merger Cloud API بیشتر بیاموزید. ما همچنین یک بخش API Reference ارائه میکنیم که به شما امکان میدهد APIهای ما را مستقیماً از طریق مرورگر تجسم کرده و با آنها تعامل داشته باشید. در صورت وجود هرگونه ابهام، لطفاً با ما در تالار گفتمان تماس بگیرید.