कुछ मामलों में, आपको PDF दस्तावेज़ों से PDF पृष्ठ निकालने की आवश्यकता हो सकती है या बड़े PDF दस्तावेज़ों को छोटी PDF फ़ाइलों में अलग करने की आवश्यकता हो सकती है। एक पायथन डेवलपर के रूप में, आप आसानी से ऑनलाइन पीडीएफ फाइलों से विशिष्ट पेजों को निकाल सकते हैं या पीडीएफ पेजों को प्रोग्रामेटिक रूप से पेज रेंज से निकाल सकते हैं। इस लेख में, आप सीखेंगे कि REST API का उपयोग करके Python में ऑनलाइन PDF फ़ाइल से पृष्ठ कैसे निकाले जाते हैं।
इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:
- दस्तावेज़ निकालने वाला REST API और पायथन SDK
- REST API का उपयोग करके Python में PDF से विशिष्ट पृष्ठ कैसे निकालें
- REST API का उपयोग करके Python में पेज रेंज द्वारा PDF से पेज निकालें
दस्तावेज़ निकालने वाला REST API और पायथन SDK
ऑनलाइन पीडीएफ फाइलों से पीडीएफ पेज निकालने के लिए, मैं GroupDocs.Merger Cloud API के पायथन एसडीके का उपयोग करूंगा। यह एक सुविधा संपन्न और उच्च प्रदर्शन वाला क्लाउड एसडीके है। यह पायथन एपीआई आपको एक दस्तावेज़ से कई फाइलों में पीडीएफ पेज निकालने में सक्षम बनाता है। एसडीके पृष्ठों की संपूर्ण या पसंदीदा श्रेणी के लिए पृष्ठ ओरिएंटेशन को पुनर्व्यवस्थित करने, हटाने, विनिमय करने, घुमाने या बदलने के लिए कार्यक्षमता प्रदान करता है। यह पीडीएफ, वर्ड, पॉवरपॉइंट, एक्सेल वर्कशीट आदि जैसे किसी भी समर्थित फ़ाइल स्वरूपों के लिए अन्य जोड़तोड़ का भी समर्थन करता है। वर्तमान में, यह .NET, Java, PHP, Ruby, Android, और Node.js SDKs को इसके दस्तावेज़ [विलय] के रूप में समर्थन करता है। 5] क्लाउड एपीआई के लिए परिवार के सदस्य।
आप कंसोल में निम्नलिखित कमांड का उपयोग करके GroupDocs.Merger-Cloud को अपने पायथन प्रोजेक्ट में स्थापित कर सकते हैं:
pip install groupdocs_merger_cloud
चरणों और उपलब्ध कोड उदाहरणों का पालन शुरू करने से पहले कृपया डैशबोर्ड से अपनी क्लाइंट आईडी और क्लाइंट सीक्रेट प्राप्त करें। एक बार आपके पास अपनी आईडी और रहस्य हो जाने के बाद, नीचे दिखाए गए कोड में जोड़ें:
# ग्रुपडॉक्स विलय एसडीके आयात करें
import groupdocs_merger_cloud
# निःशुल्क पंजीकरण के बाद https://dashboard.groupdocs.cloud से app_sid और app_key प्राप्त करें।
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# फ़ाइल एपीआई कॉन्फ़िगरेशन प्राप्त करें
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
REST API का उपयोग करके Python में PDF से विशिष्ट पृष्ठ कैसे निकालें
हमारा पीडीएफ स्प्लिटर एपीआई आपको उन पृष्ठों का पूर्वावलोकन करने की अनुमति देता है जिन्हें आप विभाजित करना चाहते हैं। आप केवल उन पृष्ठों की संख्या प्रदान करके पृष्ठों का चयन कर सकते हैं जिन्हें आप निकालना चाहते हैं। अपने PDF को तुरंत अलग-अलग पेजों में विभाजित करें, या किसी नए PDF दस्तावेज़ से विशिष्ट पेजों को निकालें। नीचे बताए गए सरल चरणों का पालन करके पीडीएफ फाइलों से पीडीएफ पेजों को ऑनलाइन निकालें:
- अपलोड क्लाउड पर पीडीएफ फाइल।
- निकालें पायथन में पेज नंबरों द्वारा पीडीएफ पेज।
- डाउनलोड निकाली गई फ़ाइलें।
दस्तावेज़ अपलोड करें
सबसे पहले, नीचे दिए गए कोड स्निपेट का उपयोग करके बहुपृष्ठ PDF दस्तावेज़ को क्लाउड पर अपलोड करें:
# पीडीएफ फाइल को क्लाउड स्टोरेज पर अपलोड करें
# फ़ाइल API का एक उदाहरण बनाएँ
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# कॉल अपलोड फ़ाइल अनुरोध
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)
# पीडीएफ फाइल को क्लाउड पर अपलोड करें
response = file_api.upload_file(request)
print(response.uploaded)
नतीजतन, पीडीएफ फाइल क्लाउड स्टोरेज पर अपलोड की जाएगी और आपके डैशबोर्ड के फाइल सेक्शन में उपलब्ध होगी। हम अपलोड करने के 24 घंटे के भीतर आपकी सभी फाइलों को क्लाउड से स्थायी रूप से हटा देते हैं।
पायथन का उपयोग करके पृष्ठ संख्या द्वारा विशिष्ट पृष्ठ निकालें
पीडीएफ दस्तावेज़ से एक विशिष्ट पृष्ठ या एकाधिक पृष्ठों को प्रोग्रामेटिक रूप से निकालने के लिए, नीचे दिए गए चरणों का पालन करें:
- सबसे पहले, एक PagesApi उदाहरण बनाएँ
- दूसरे, ExtractOptions उदाहरण प्रदान करें
- अब, FileInfo उदाहरण के साथ इनपुट फ़ाइल पथ सेट करें
- अगला, आउटपुट निर्देशिका पथ सेट करें
- फिर, अल्पविराम से अलग किए गए पेज नंबर निकालने के लिए प्रदान करें
- इसके बाद, मोड को पेज पर सेट करें
- अगला, ExtractRequest उदाहरण बनाएँ
- अंत में, pagesApi.extract() वर्ग को कॉल करके परिणाम प्राप्त करें
निम्न कोड उदाहरण दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से विशिष्ट पृष्ठ संख्याएँ प्रदान करके पृष्ठों को कैसे निकाला जाए:
# REST API का उपयोग करके Python में PDF से विशिष्ट पृष्ठ कैसे निकालें
try:
# पेज एपीआई का एक उदाहरण बनाएं
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
options.output_path = "python-testing"
options.pages = [2, 4, 7]
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
एक्सट्रैक्टेड पीडीएफ पेज फाइल डाउनलोड करें
उपरोक्त कोड नमूना क्लाउड पर अलग-अलग पीडीएफ फाइलों में निकाले गए पृष्ठों को सहेज लेगा। आप निम्न कोड नमूने का उपयोग करके उन्हें डाउनलोड कर सकते हैं:
# परिवर्तित फ़ाइल को डाउनलोड करने के लिए एपीआई आरंभीकरण
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# डाउनलोड फ़ाइल अनुरोध बनाएँ
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)
# परिवर्तित फ़ाइल डाउनलोड करें
response = file_api.download_file(request)
# डाउनलोड की गई फ़ाइल को अपनी निर्देशिका में ले जाएं
shutil.move(response, "H:\\groupdocs-cloud-data\\")
रेस्ट एपीआई का उपयोग करके पायथन में पेज रेंज द्वारा पीडीएफ से पेज निकालें
प्रोग्रामेटिक रूप से पृष्ठ श्रेणी प्रदान करके किसी PDF दस्तावेज़ से पृष्ठ निकालने के लिए कृपया नीचे दिए गए चरणों का पालन करें।
- सबसे पहले, एक PagesApi उदाहरण बनाएँ
- अगला, ExtractOptions सेट करें
- FileInfo उदाहरण के साथ इनपुट फ़ाइल पथ सेट करें
- अगला, आउटपुट निर्देशिका पथ सेट करें
- निकालने के लिए प्रारंभ पृष्ठ संख्या और अंतिम पृष्ठ संख्या सेट करके पृष्ठ श्रेणी प्रदान करें
- अब, मोड अंतराल को Pages पर सेट करें
- रेंजमोड को ईवनपेज या ऑडपेज पर सेट करें
- अगला, ExtractRequest उदाहरण बनाएँ
- अंत में, pagesApi.extract() विधि को कॉल करके परिणाम प्राप्त करें
निम्न कोड उदाहरण दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से पृष्ठ श्रेणी प्रदान करके पृष्ठों को कैसे निकाला जाए। फ़ाइलों को अपलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।
# रेस्ट एपीआई का उपयोग करके पायथन में पेज रेंज द्वारा पीडीएफ से पेज कैसे निकालें
try:
# दस्तावेज़ API का एक उदाहरण बनाएँ
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
options.output_path = "python-testing"
options.start_page_number = 1
options.end_page_number = 10
options.range_mode = "EvenPages" # or set range_mode to "OddPages"
options.mode = "Pages" # Mode Intervals
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
ऑनलाइन पीडीएफ पेज एक्सट्रैक्टर मुफ्त
पीडीएफ से मुफ्त पेज कैसे निकालें? कृपया निम्नलिखित मुफ्त ऑनलाइन पीडीएफ एक्सट्रैक्टर टूल का प्रयास करें, जिसे उपरोक्त एपीआई का उपयोग करके विकसित किया गया है।
उपसंहार
यह हमें ब्लॉग पोस्ट के निष्कर्ष पर लाता है। मुझे आशा है कि आपने सीखा है:
- कैसे पायथन में पीडीएफ दस्तावेजों से विशिष्ट पृष्ठों को निकालने के लिए;
- पीडीएफ फाइल को प्रोग्रामेटिक रूप से अपलोड करें और फिर क्लाउड से निकाली गई फाइलों को डाउनलोड करें;
- पायथन का उपयोग करके पेज रेंज का उपयोग करके पीडीएफ फाइल पेज कैसे निकालें;
दस्तावेज़ का उपयोग करके आप GroupDocs.Merger Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है।
हमारे प्रारंभ करना पृष्ठ, पर आप अधिक विवरण खोज सकते हैं।
इसके अलावा, Groupdocs.cloud लगातार नए विषयों के साथ अद्यतन किया जाता है। नतीजतन, सबसे नवीनतम एपीआई जानकारी पर अद्यतित रहें।
प्रश्न पूछें
आप हमारे मुफ्त समर्थन फोरम के माध्यम से पीडीएफ पेज एक्सट्रैक्टर सॉफ्टवेयर एपीआई के बारे में अपने प्रश्न पूछ सकते हैं।
पूछे जाने वाले प्रश्न
पायथन में पीडीएफ फाइल से पेज कैसे निकालें?
कृपया इस लिंक का पालन करें, पायथन में पीडीएफ फाइलों से पेज निकालने के तरीके के बारे में पायथन कोड स्निपेट सीखने के लिए।
REST API का उपयोग करके PDF दस्तावेज़ों से ऑनलाइन पृष्ठ कैसे निकालें?
PagesApi का एक उदाहरण बनाएं, ExtractOptions के मान सेट करें, और PDF फ़ाइल के चयनित पृष्ठों को ऑनलाइन सहेजने के लिए pagesApi.extract () विधि ExtractRequest के साथ शुरू करें।
पीडीएफ पेज एक्सट्रैक्टर मुफ्त डाउनलोड लाइब्रेरी कैसे स्थापित करें?
पीडीएफ से पृष्ठों को निकालने का एक आसान तरीका पायथन एसडीके का उपयोग कर रहा है। आप प्रोग्रामेटिक रूप से पीडीएफ फाइलों से कई पेज निकालने के लिए पीडीएफ एक्सट्रैक्टर पायथन लाइब्रेरी स्थापित कर सकते हैं।
मैं विंडोज़ में पीडीएफ पेजों को ऑफलाइन कैसे एक्सट्रैक्ट कर सकता हूं?
विंडोज़ के लिए पीडीएफ एक्सट्रैक्टर सॉफ्टवेयर डाउनलोड करने के लिए कृपया इस लिंक पर जाएं। यह पीडीएफ एक्सट्रैक्टर मुफ्त डाउनलोड सॉफ्टवेयर एक क्लिक के साथ विंडोज में पीडीएफ पेजों को जल्दी से विभाजित कर देगा।
यह सभी देखें
- पायथन का उपयोग करके पीडीएफ से टेक्स्ट निकालें
- रूबी में REST API का उपयोग करके PowerPoint PPT/PPTX फ़ाइलों को ऑनलाइन मर्ज करें
- पायथन का उपयोग करके पीडीएफ से विशिष्ट डेटा निकालें
- पायथन में CSV को JSON और JSON को CSV में बदलें
- REST API का उपयोग करके PDF फ़ाइलों को मर्ज करें
- पायथन में SVG को PNG उच्च गुणवत्ता में बदलें
- पायथन में CSV को JSON और JSON को CSV में बदलें
- REST API का उपयोग करके पायथन में पीडीएफ को एक्सेल में कैसे बदलें