आपको PDF दस्तावेज़ों से विशिष्ट पृष्ठ निकालने की आवश्यकता हो सकती है या बड़े PDF दस्तावेज़ों को छोटे भागों में विभाजित करने की आवश्यकता हो सकती है। एक पायथन डेवलपर के रूप में, आप आसानी से पीडीएफ दस्तावेज़ों से विशिष्ट पृष्ठों को पृष्ठ संख्या या प्रोग्रामेटिक रूप से पृष्ठों की एक श्रृंखला से निकाल सकते हैं। इस लेख में, आप सीखेंगे कि पायथन में REST API का उपयोग करके PDF दस्तावेज़ों से विशिष्ट पृष्ठ कैसे निकाले जाते हैं।
इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:
- दस्तावेज़ स्प्लिटर रेस्ट एपीआई और पायथन एसडीके
- REST API का उपयोग करके PDF से विशिष्ट पृष्ठ निकालें
- पायथन का उपयोग करके पेज रेंज द्वारा पेज निकालें
दस्तावेज़ स्प्लिटर रेस्ट एपीआई और पायथन एसडीके
PDF दस्तावेज़ों से पृष्ठ निकालने के लिए, मैं Python SDK of GroupDocs.Merger Cloud API का उपयोग करूंगा। यह एक सुविधा-संपन्न और उच्च-प्रदर्शन वाला क्लाउड SDK है जिसका उपयोग कई दस्तावेज़ों को एक दस्तावेज़ में मर्ज करने के लिए किया जाता है। यह आपको एक दस्तावेज़ को कई दस्तावेज़ों में विभाजित करने में भी सक्षम बनाता है। एसडीके पृष्ठों की संपूर्ण या पसंदीदा श्रेणी के लिए पेज ओरिएंटेशन को हटाने, विनिमय करने, घुमाने या बदलने के लिए कार्यक्षमता प्रदान करता है और पीडीएफ, वर्ड, पावरपॉइंट और एक्सेल वर्कशीट जैसे किसी भी समर्थित फ़ाइल स्वरूपों के लिए आसानी से अन्य जोड़तोड़ करता है। वर्तमान में, यह क्लाउड एपीआई के लिए अपने दस्तावेज़ विलय परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby, Android, और Node.js SDKs भी प्रदान करता है।
आप कंसोल में निम्नलिखित कमांड का उपयोग करके GroupDocs.Merger-Cloud को अपने पायथन प्रोजेक्ट में स्थापित कर सकते हैं:
pip install groupdocs_merger_cloud
चरणों और उपलब्ध कोड उदाहरणों का पालन करना शुरू करने से पहले कृपया डैशबोर्ड से अपनी क्लाइंट आईडी और क्लाइंट सीक्रेट प्राप्त करें। एक बार आपके पास अपनी आईडी और रहस्य हो जाने के बाद, नीचे दिखाए गए कोड में जोड़ें:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
पायथन में REST API का उपयोग करके PDF से विशिष्ट पृष्ठ निकालें
आप नीचे बताए गए सरल चरणों का पालन करके पीडीएफ दस्तावेज़ों से विशिष्ट पृष्ठ निकाल सकते हैं:
- अपलोड क्लाउड पर पीडीएफ फाइल
- एक्सट्रैक्ट स्पेसिफिक पेज बाय पेज नंबर्स अपलोड की गई पीडीएफ फाइल से
- डाउनलोड निकाली गई फ़ाइल (फ़ाइलें)
दस्तावेज़ अपलोड करें
सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके मल्टीपेज पीडीएफ दस्तावेज़ को क्लाउड पर अपलोड करें:
# एपीआई का उदाहरण बनाएँ
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# नमूना फ़ाइलें अपलोड करें
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)
नतीजतन, पीडीएफ फाइल क्लाउड स्टोरेज पर अपलोड की जाएगी और आपके डैशबोर्ड के फाइल सेक्शन में उपलब्ध होगी।
पायथन का उपयोग करके पृष्ठ संख्या द्वारा विशिष्ट पृष्ठ निकालें
किसी PDF दस्तावेज़ से प्रोग्रामेटिक रूप से किसी विशिष्ट पृष्ठ या एकाधिक पृष्ठों को निकालने के लिए कृपया नीचे दिए गए चरणों का पालन करें।
- एक दस्तावेज़ एपीआई उदाहरण बनाएँ
- स्प्लिटऑप्शन प्रदान करें
- इनपुट फ़ाइल पथ सेट करें
- आउटपुट निर्देशिका पथ सेट करें
- निकालने के लिए अल्पविराम से अलग किए गए पेज नंबर प्रदान करें
- मोड को पेज पर सेट करें
- स्प्लिट रिक्वेस्ट बनाएं
- DocumentApi.split() विधि को कॉल करके परिणाम प्राप्त करें
निम्न कोड उदाहरण दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से विशिष्ट पृष्ठ संख्याएँ प्रदान करके पृष्ठों को कैसे निकाला जाए।
# एपीआई आरंभीकरण
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
# विभाजन विकल्पों को परिभाषित करें
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"
# विभाजन अनुरोध बनाएँ
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
निकाली गई पृष्ठ फ़ाइलें डाउनलोड करें
उपरोक्त कोड नमूना क्लाउड पर अलग-अलग पीडीएफ फाइलों में निकाले गए पृष्ठों को सहेज लेगा। आप निम्न कोड नमूने का उपयोग करके उन्हें डाउनलोड कर सकते हैं:
# एपीआई आरंभीकरण
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# फ़ाइल अनुरोध डाउनलोड करें
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)
# डाउनलोड की गई फ़ाइल को अपनी कार्यशील निर्देशिका में ले जाएँ
shutil.move(response, "C:\\Files\\")
पायथन का उपयोग करके पेज रेंज द्वारा पेज निकालें
प्रोग्रामेटिक रूप से पृष्ठ श्रेणी प्रदान करके किसी PDF दस्तावेज़ से पृष्ठ निकालने के लिए कृपया नीचे दिए गए चरणों का पालन करें।
- एक दस्तावेज़ एपीआई उदाहरण बनाएँ
- स्प्लिटऑप्शन प्रदान करें
- इनपुट फ़ाइल पथ सेट करें
- आउटपुट निर्देशिका पथ सेट करें
- निकालने के लिए प्रारंभ पृष्ठ संख्या और अंतिम पृष्ठ संख्या सेट करके पृष्ठ श्रेणी प्रदान करें
- मोड को पेज पर सेट करें
- स्प्लिट रिक्वेस्ट बनाएं
- DocumentApi.split() विधि को कॉल करके परिणाम प्राप्त करें
- डाउनलोड फ़ाइल अनुरोध बनाएँ
- FileApi.download\file() विधि को कॉल करके फ़ाइल डाउनलोड करें
निम्न कोड उदाहरण दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से पृष्ठ श्रेणी प्रदान करके पृष्ठों को कैसे निकाला जाए। फ़ाइलों को अपलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।
# एपीआई आरंभीकरण
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# विभाजन विकल्पों को परिभाषित करें
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"
# विभाजन अनुरोध बनाएँ
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
# एक-एक करके परिणाम दिखाएं और फ़ाइलें डाउनलोड करें
for data in result.documents:
print("Document Url = " + str(data))
# डाउनलोड फ़ाइल अनुरोध बनाएँ
request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
response = file_api.download_file(request)
# डाउनलोड की गई फ़ाइल को अपनी कार्यशील निर्देशिका में ले जाएँ
shutil.move(response, "C:\\Files\\")
ऑनलाइन प्रयास करें
कृपया निम्नलिखित मुफ्त ऑनलाइन पीडीएफ स्प्लिटर टूल का प्रयास करें, जिसे उपरोक्त एपीआई का उपयोग करके विकसित किया गया है। https://products.groupdocs.app/splitter/pdf
निष्कर्ष
इस लेख में, आपने सीखा है कि पायथन का उपयोग करके क्लाउड पर पीडीएफ दस्तावेज़ों से विशिष्ट पृष्ठ कैसे निकाले जाते हैं। आपने यह भी सीखा कि क्लाउड पर पीडीएफ फाइल को प्रोग्रामेटिक रूप से कैसे अपलोड किया जाए और फिर क्लाउड से निकाली गई फाइलों को डाउनलोड किया जाए। आप दस्तावेज़ का उपयोग करके GroupDocs.Merger Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है। किसी भी अस्पष्टता के मामले में, कृपया बेझिझक हमसे फोरम पर संपर्क करें।