पीडीएफ दस्तावेजों से छवियां निकालें

आपको अपने PDF या Word दस्तावेज़ों का पुन: उपयोग करने के लिए छवियों को निकालने की आवश्यकता हो सकती है। आप क्लाउड पर प्रोग्रामेटिक रूप से PDF दस्तावेज़ों से छवियों को आसानी से निकाल सकते हैं। यह लेख समझाएगा कि पायथन में REST API का उपयोग करके PDF दस्तावेज़ों से चित्र कैसे निकाले जाएँ।

इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:

दस्तावेज़ पार्सर रेस्ट एपीआई और पायथन एसडीके

एक पीडीएफ दस्तावेज़ से छवियों को निकालने के लिए, मैं ग्रुपडॉक्स के पायथन एसडीके। पार्सर क्लाउड एपीआई का उपयोग करूंगा। यह आपको सभी लोकप्रिय दस्तावेज़ प्रकारों से डेटा पार्स करने की अनुमति देता है। आप एसडीके का उपयोग कर टेम्पलेट द्वारा टेक्स्ट, इमेज और डेटा पार्स कर सकते हैं। यह क्लाउड एपीआई के लिए अपने दस्तावेज़ पार्सर परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby और Node.js SDK भी प्रदान करता है।

आप कंसोल में निम्न आदेश का उपयोग करके पाइप (पायथन के लिए पैकेज इंस्टॉलर) के साथ अपने पायथन प्रोजेक्ट में GroupDocs.Parser क्लाउड स्थापित कर सकते हैं:

pip install groupdocs_parser_cloud

चरणों और उपलब्ध कोड उदाहरणों का पालन शुरू करने से पहले कृपया डैशबोर्ड से अपनी क्लाइंट आईडी और क्लाइंट सीक्रेट प्राप्त करें। एक बार आपके पास अपनी क्लाइंट आईडी और सीक्रेट होने के बाद, नीचे दिखाए गए अनुसार कोड जोड़ें:

client_id = "112f0f38-9dae-42d5-b4fc-cc84ae644972"
client_secret = "16ad3fe0bdc39c910f57d2fd48a5d618"

configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

पायथन में REST API का उपयोग करके PDF से चित्र निकालें

आप नीचे बताए गए सरल चरणों का पालन करके पीडीएफ दस्तावेज़ों से छवियां निकाल सकते हैं:

दस्तावेज़ अपलोड करें

सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके PDF दस्तावेज़ को क्लाउड पर अपलोड करें:

# एपीआई आरंभीकरण
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""

request = groupdocs_parser_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

परिणामस्वरूप, अपलोड की गई PDF फ़ाइल (sample.pdf) क्लाउड पर आपके डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।

पायथन का उपयोग करके पीडीएफ दस्तावेज़ से सभी छवियां निकालें

आप नीचे बताए गए चरणों का पालन करके आसानी से पीडीएफ फाइल से सभी छवियों को प्रोग्रामेटिक रूप से निकाल सकते हैं।

  • ParseApi का एक उदाहरण बनाएँ
  • ImageOptions को परिभाषित करें
  • पीडीएफ फाइल के लिए पथ सेट करें
  • इमेज रिक्वेस्ट बनाएं
  • ParseApi.images() विधि को कॉल करके परिणाम प्राप्त करें

निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से सभी छवियों को कैसे निकाला जाए।

# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"

# अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for image in result.images:
    print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
    print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
पीडीएफ दस्तावेज़ से सभी छवियां निकालें।

पीडीएफ दस्तावेज़ से सभी छवियां निकालें।

निकाली गई छवियां डाउनलोड करें

उपरोक्त कोड नमूना क्लाउड पर निकाली गई छवियों को सहेजेगा। आप नीचे दिए गए कोड नमूने का उपयोग करके इन छवियों को डाउनलोड कर सकते हैं:

# एपीआई आरंभीकरण
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
  
# छवि डाउनलोड करें 
request = groupdocs_parser_cloud.DownloadFileRequest(image.path, my_storage)
response = file_api.download_file(request)

# डाउनलोड की गई फ़ाइल को अपनी कार्यशील निर्देशिका में ले जाएँ
shutil.move(response, "C:\\Files\\Images")

पायथन का उपयोग करके पीडीएफ दस्तावेज़ों से पृष्ठ संख्या द्वारा चित्र सहेजें

आप नीचे बताए गए चरणों का पालन करके आसानी से पीडीएफ फाइल के विशिष्ट पृष्ठों से छवियों को प्रोग्रामेटिक रूप से निकाल सकते हैं।

  • ParseApi का एक उदाहरण बनाएँ
  • ImageOptions को परिभाषित करें
  • पीडीएफ फाइल को पथ प्रदान करें
  • प्रारंभ पृष्ठ संख्या सेट करें
  • निकालने के लिए पृष्ठों की संख्या निर्धारित करें
  • इमेज रिक्वेस्ट बनाएं
  • ParseApi.images() पद्धति को कॉल करके परिणाम प्राप्त करें

निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से पृष्ठ संख्या श्रेणी द्वारा छवियों को कैसे निकाला जाए। निकाली गई छवियों को डाउनलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।

# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# पृष्ठ श्रेणी परिभाषित करें
options.start_page_number = 1
options.count_pages_to_extract = 1

# अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
पीडीएफ दस्तावेज़ से पृष्ठ संख्या श्रेणी के अनुसार चित्र निकालें।

पीडीएफ दस्तावेज़ से पृष्ठ संख्या सीमा के अनुसार चित्र निकालें।

पायथन का उपयोग करके पीडीएफ के साथ संलग्न दस्तावेज़ से चित्र प्राप्त करें

आप नीचे दिए गए चरणों का पालन करके प्रोग्रामेटिक रूप से एक पीडीएफ फाइल में अटैचमेंट के रूप में उपलब्ध एक कंटेनर के अंदर एक दस्तावेज़ से छवियों को निकाल सकते हैं।

  • ParseApi का एक उदाहरण बनाएँ
  • ImageOptions को परिभाषित करें
  • पीडीएफ फाइल के लिए पथ सेट करें
  • कंटेनरआइटमइन्फो को परिभाषित करें
  • अंदर के दस्तावेज़ का सापेक्ष पथ प्रदान करें
  • प्रारंभ पृष्ठ संख्या सेट करें
  • निकालने के लिए पृष्ठों की संख्या निर्धारित करें
  • इमेज रिक्वेस्ट बनाएं
  • ParseApi.images() विधि को कॉल करके परिणाम प्राप्त करें

निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ के अंदर दस्तावेज़ से छवियों को कैसे निकाला जाए। निकाली गई छवियों को डाउनलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।

# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "PDF_with_attachements.pdf"
options.file_info.password = "password"
# कंटेनर आइटम सेट करें
container_info = groupdocs_parser_cloud.ContainerItemInfo()
container_info.relative_path = "template-document.pdf"
options.container_item_info = container_info
# पृष्ठ श्रेणी परिभाषित करें
options.start_page_number = 2
options.count_pages_to_extract = 1

# अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
पीडीएफ दस्तावेज़ में संलग्न दस्तावेज़ से छवियां निकालें

पीडीएफ दस्तावेज़ में संलग्न दस्तावेज़ से छवियां निकालें।

ऑनलाइन प्रयास करें

कृपया निम्नलिखित मुफ्त ऑनलाइन पीडीएफ पार्सिंग टूल का प्रयास करें, जिसे उपरोक्त एपीआई का उपयोग करके विकसित किया गया है। https://products.groupdocs.app/parser/pdf

निष्कर्ष

इस लेख में, आपने क्लाउड पर PDF दस्तावेज़ों से छवियों को निकालने का तरीका सीखा है। इस लेख में यह भी बताया गया है कि क्लाउड पर पीडीएफ फाइल को प्रोग्रामेटिक रूप से कैसे अपलोड किया जाए। आपने यह भी सीखा कि SDK का उपयोग करके निकाली गई छवियों को कैसे डाउनलोड किया जाता है। आप दस्तावेज़ का उपयोग करके GroupDocs.Parser Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है। किसी भी अस्पष्टता के मामले में, कृपया बेझिझक हमसे फोरम पर संपर्क करें।

यह सभी देखें