पायथन में ऑनलाइन पीडीएफ फाइल से पेज कैसे निकालें

पायथन में पीडीएफ फाइल ऑनलाइन से पेज निकालें

कुछ मामलों में, आपको PDF दस्तावेज़ों से PDF पृष्ठ निकालने की आवश्यकता हो सकती है या बड़े PDF दस्तावेज़ों को छोटी PDF फ़ाइलों में अलग करने की आवश्यकता हो सकती है। एक पायथन डेवलपर के रूप में, आप आसानी से ऑनलाइन पीडीएफ फाइलों से विशिष्ट पेजों को निकाल सकते हैं या पीडीएफ पेजों को प्रोग्रामेटिक रूप से पेज रेंज से निकाल सकते हैं। इस लेख में, आप सीखेंगे कि REST API का उपयोग करके Python में ऑनलाइन PDF फ़ाइल से पृष्ठ कैसे निकाले जाते हैं।

इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:

दस्तावेज़ निकालने वाला REST API और पायथन SDK

ऑनलाइन पीडीएफ फाइलों से पीडीएफ पेज निकालने के लिए, मैं GroupDocs.Merger Cloud API के पायथन एसडीके का उपयोग करूंगा। यह एक सुविधा संपन्न और उच्च प्रदर्शन वाला क्लाउड एसडीके है। यह पायथन एपीआई आपको एक दस्तावेज़ से कई फाइलों में पीडीएफ पेज निकालने में सक्षम बनाता है। एसडीके पृष्ठों की संपूर्ण या पसंदीदा श्रेणी के लिए पृष्ठ ओरिएंटेशन को पुनर्व्यवस्थित करने, हटाने, विनिमय करने, घुमाने या बदलने के लिए कार्यक्षमता प्रदान करता है। यह पीडीएफ, वर्ड, पॉवरपॉइंट, एक्सेल वर्कशीट आदि जैसे किसी भी समर्थित फ़ाइल स्वरूपों के लिए अन्य जोड़तोड़ का भी समर्थन करता है। वर्तमान में, यह .NET, Java, PHP, Ruby, Android, और Node.js SDKs को इसके दस्तावेज़ [विलय] के रूप में समर्थन करता है। 5] क्लाउड एपीआई के लिए परिवार के सदस्य।

आप कंसोल में निम्नलिखित कमांड का उपयोग करके GroupDocs.Merger-Cloud को अपने पायथन प्रोजेक्ट में स्थापित कर सकते हैं:

pip install groupdocs_merger_cloud

चरणों और उपलब्ध कोड उदाहरणों का पालन शुरू करने से पहले कृपया डैशबोर्ड से अपनी क्लाइंट आईडी और क्लाइंट सीक्रेट प्राप्त करें। एक बार आपके पास अपनी आईडी और रहस्य हो जाने के बाद, नीचे दिखाए गए कोड में जोड़ें:

# ग्रुपडॉक्स विलय एसडीके आयात करें
import groupdocs_merger_cloud

# निःशुल्क पंजीकरण के बाद https://dashboard.groupdocs.cloud से app_sid और app_key प्राप्त करें।
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# फ़ाइल एपीआई कॉन्फ़िगरेशन प्राप्त करें 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

REST API का उपयोग करके Python में PDF से विशिष्ट पृष्ठ कैसे निकालें

हमारा पीडीएफ स्प्लिटर एपीआई आपको उन पृष्ठों का पूर्वावलोकन करने की अनुमति देता है जिन्हें आप विभाजित करना चाहते हैं। आप केवल उन पृष्ठों की संख्या प्रदान करके पृष्ठों का चयन कर सकते हैं जिन्हें आप निकालना चाहते हैं। अपने PDF को तुरंत अलग-अलग पेजों में विभाजित करें, या किसी नए PDF दस्तावेज़ से विशिष्ट पेजों को निकालें। नीचे बताए गए सरल चरणों का पालन करके पीडीएफ फाइलों से पीडीएफ पेजों को ऑनलाइन निकालें:

  1. अपलोड क्लाउड पर पीडीएफ फाइल।
  2. निकालें पायथन में पेज नंबरों द्वारा पीडीएफ पेज।
  3. डाउनलोड निकाली गई फ़ाइलें।

दस्तावेज़ अपलोड करें

सबसे पहले, नीचे दिए गए कोड स्निपेट का उपयोग करके बहुपृष्ठ PDF दस्तावेज़ को क्लाउड पर अपलोड करें:

# पीडीएफ फाइल को क्लाउड स्टोरेज पर अपलोड करें
# फ़ाइल API का एक उदाहरण बनाएँ
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# कॉल अपलोड फ़ाइल अनुरोध
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)

# पीडीएफ फाइल को क्लाउड पर अपलोड करें
response = file_api.upload_file(request)
print(response.uploaded)

नतीजतन, पीडीएफ फाइल क्लाउड स्टोरेज पर अपलोड की जाएगी और आपके डैशबोर्ड के फाइल सेक्शन में उपलब्ध होगी। हम अपलोड करने के 24 घंटे के भीतर आपकी सभी फाइलों को क्लाउड से स्थायी रूप से हटा देते हैं।

पायथन का उपयोग करके पृष्ठ संख्या द्वारा विशिष्ट पृष्ठ निकालें

पीडीएफ दस्तावेज़ से एक विशिष्ट पृष्ठ या एकाधिक पृष्ठों को प्रोग्रामेटिक रूप से निकालने के लिए, नीचे दिए गए चरणों का पालन करें:

  • सबसे पहले, एक PagesApi उदाहरण बनाएँ
  • दूसरे, ExtractOptions उदाहरण प्रदान करें
  • अब, FileInfo उदाहरण के साथ इनपुट फ़ाइल पथ सेट करें
  • अगला, आउटपुट निर्देशिका पथ सेट करें
  • फिर, अल्पविराम से अलग किए गए पेज नंबर निकालने के लिए प्रदान करें
  • इसके बाद, मोड को पेज पर सेट करें
  • अगला, ExtractRequest उदाहरण बनाएँ
  • अंत में, pagesApi.extract() वर्ग को कॉल करके परिणाम प्राप्त करें

निम्न कोड उदाहरण दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से विशिष्ट पृष्ठ संख्याएँ प्रदान करके पृष्ठों को कैसे निकाला जाए:

# REST API का उपयोग करके Python में PDF से विशिष्ट पृष्ठ कैसे निकालें
try:
    # पेज एपीआई का एक उदाहरण बनाएं
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
    options.output_path = "python-testing"
    options.pages = [2, 4, 7]        
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

एक्सट्रैक्टेड पीडीएफ पेज फाइल डाउनलोड करें

उपरोक्त कोड नमूना क्लाउड पर अलग-अलग पीडीएफ फाइलों में निकाले गए पृष्ठों को सहेज लेगा। आप निम्न कोड नमूने का उपयोग करके उन्हें डाउनलोड कर सकते हैं:

# परिवर्तित फ़ाइल को डाउनलोड करने के लिए एपीआई आरंभीकरण
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# डाउनलोड फ़ाइल अनुरोध बनाएँ
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)

# परिवर्तित फ़ाइल डाउनलोड करें
response = file_api.download_file(request)

# डाउनलोड की गई फ़ाइल को अपनी निर्देशिका में ले जाएं
shutil.move(response, "H:\\groupdocs-cloud-data\\")

रेस्ट एपीआई का उपयोग करके पायथन में पेज रेंज द्वारा पीडीएफ से पेज निकालें

प्रोग्रामेटिक रूप से पृष्ठ श्रेणी प्रदान करके किसी PDF दस्तावेज़ से पृष्ठ निकालने के लिए कृपया नीचे दिए गए चरणों का पालन करें।

  • सबसे पहले, एक PagesApi उदाहरण बनाएँ
  • अगला, ExtractOptions सेट करें
  • FileInfo उदाहरण के साथ इनपुट फ़ाइल पथ सेट करें
  • अगला, आउटपुट निर्देशिका पथ सेट करें
  • निकालने के लिए प्रारंभ पृष्ठ संख्या और अंतिम पृष्ठ संख्या सेट करके पृष्ठ श्रेणी प्रदान करें
  • अब, मोड अंतराल को Pages पर सेट करें
  • रेंजमोड को ईवनपेज या ऑडपेज पर सेट करें
  • अगला, ExtractRequest उदाहरण बनाएँ
  • अंत में, pagesApi.extract() विधि को कॉल करके परिणाम प्राप्त करें

निम्न कोड उदाहरण दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से पृष्ठ श्रेणी प्रदान करके पृष्ठों को कैसे निकाला जाए। फ़ाइलों को अपलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।

# रेस्ट एपीआई का उपयोग करके पायथन में पेज रेंज द्वारा पीडीएफ से पेज कैसे निकालें
try:
    # दस्तावेज़ API का एक उदाहरण बनाएँ
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
    options.output_path = "python-testing"
    options.start_page_number = 1
    options.end_page_number = 10
    options.range_mode = "EvenPages" # or set range_mode to "OddPages"
    options.mode = "Pages" # Mode Intervals
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

ऑनलाइन पीडीएफ पेज एक्सट्रैक्टर मुफ्त

पीडीएफ से मुफ्त पेज कैसे निकालें? कृपया निम्नलिखित मुफ्त ऑनलाइन पीडीएफ एक्सट्रैक्टर टूल का प्रयास करें, जिसे उपरोक्त एपीआई का उपयोग करके विकसित किया गया है।

उपसंहार

यह हमें ब्लॉग पोस्ट के निष्कर्ष पर लाता है। मुझे आशा है कि आपने सीखा है:

  • कैसे पायथन में पीडीएफ दस्तावेजों से विशिष्ट पृष्ठों को निकालने के लिए;
  • पीडीएफ फाइल को प्रोग्रामेटिक रूप से अपलोड करें और फिर क्लाउड से निकाली गई फाइलों को डाउनलोड करें;
  • पायथन का उपयोग करके पेज रेंज का उपयोग करके पीडीएफ फाइल पेज कैसे निकालें;

दस्तावेज़ का उपयोग करके आप GroupDocs.Merger Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है।

हमारे प्रारंभ करना पृष्ठ, पर आप अधिक विवरण खोज सकते हैं।

इसके अलावा, Groupdocs.cloud लगातार नए विषयों के साथ अद्यतन किया जाता है। नतीजतन, सबसे नवीनतम एपीआई जानकारी पर अद्यतित रहें।

प्रश्न पूछें

आप हमारे मुफ्त समर्थन फोरम के माध्यम से पीडीएफ पेज एक्सट्रैक्टर सॉफ्टवेयर एपीआई के बारे में अपने प्रश्न पूछ सकते हैं।

पूछे जाने वाले प्रश्न

पायथन में पीडीएफ फाइल से पेज कैसे निकालें?

कृपया इस लिंक का पालन करें, पायथन में पीडीएफ फाइलों से पेज निकालने के तरीके के बारे में पायथन कोड स्निपेट सीखने के लिए।

REST API का उपयोग करके PDF दस्तावेज़ों से ऑनलाइन पृष्ठ कैसे निकालें?

PagesApi का एक उदाहरण बनाएं, ExtractOptions के मान सेट करें, और PDF फ़ाइल के चयनित पृष्ठों को ऑनलाइन सहेजने के लिए pagesApi.extract () विधि ExtractRequest के साथ शुरू करें।

पीडीएफ पेज एक्सट्रैक्टर मुफ्त डाउनलोड लाइब्रेरी कैसे स्थापित करें?

पीडीएफ से पृष्ठों को निकालने का एक आसान तरीका पायथन एसडीके का उपयोग कर रहा है। आप प्रोग्रामेटिक रूप से पीडीएफ फाइलों से कई पेज निकालने के लिए पीडीएफ एक्सट्रैक्टर पायथन लाइब्रेरी स्थापित कर सकते हैं।

मैं विंडोज़ में पीडीएफ पेजों को ऑफलाइन कैसे एक्सट्रैक्ट कर सकता हूं?

विंडोज़ के लिए पीडीएफ एक्सट्रैक्टर सॉफ्टवेयर डाउनलोड करने के लिए कृपया इस लिंक पर जाएं। यह पीडीएफ एक्सट्रैक्टर मुफ्त डाउनलोड सॉफ्टवेयर एक क्लिक के साथ विंडोज में पीडीएफ पेजों को जल्दी से विभाजित कर देगा।

यह सभी देखें