पायथन का उपयोग करके दस्तावेज़ों से छवियाँ निकालें

यदि आप एक पायथन डेवलपर हैं और दस्तावेजों से डेटा निकालना चाहते हैं, तो यह लेख आपको सरल पायथन उदाहरणों का उपयोग करके विभिन्न वर्ड प्रोसेसिंग दस्तावेजों, स्प्रेडशीट, प्रस्तुतियों और पीडीएफ दस्तावेजों से छवियां निकालने के लिए मार्गदर्शन करेगा।

आज निम्नलिखित विषयों को कवर किया जाएगा:

इमेज एक्सट्रैक्शन REST API और पायथन SDK

दस्तावेज़ पार्सिंग पायथन एसडीके

इस बार, हम विभिन्न प्रकार के दस्तावेजों से छवियों को निकालने के लिए GroupDocs.Parser Cloud API के पायथन एसडीके का उपयोग करेंगे। हालाँकि, वर्तमान में, यह क्लाउड एपीआई के लिए दस्तावेज़ पार्सिंग परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby और Node.js SDK भी प्रदान करता है।

एपीआई वर्ड प्रोसेसिंग दस्तावेज़, स्प्रेडशीट, प्रेजेंटेशन, ईमेल, अभिलेखागार, मार्कअप और पीडीएफ दस्तावेजों जैसे विभिन्न प्रकार के दस्तावेज़ों से छवियां निकालने के साथ-साथ टेक्स्ट और मेटाडेटा निष्कर्षण का भी समर्थन करता है।

उद्देश्य पर आते हुए, सबसे पहले, चरणों और उपलब्ध कोड उदाहरणों का पालन शुरू करने से पहले डैशबोर्ड से अपनी एपीपी कुंजी और एपीपी एसआईडी प्राप्त करें।

पायथन का उपयोग करके पीडीएफ से छवियाँ निकालें

छवियाँ निकालने के लिए पीडीएफ दस्तावेज़, पीडीएफ से छवियाँ प्राप्त करें या पीडीएफ से छवि निकालें

उदाहरण के तौर पर, सबसे पहले मैं एक पीडीएफ दस्तावेज़ से छवियां निकालूंगा। केवल सरल चरणों का पालन करके, सभी छवियां आसानी से निकाली जा सकती हैं।

  • पीडीएफ दस्तावेज़ को क्लाउड पर अपलोड करें।
  • अपलोड किए गए दस्तावेज़ से छवियाँ निकालें।
  • निकाले गए चित्र डाउनलोड करें.

पीडीएफ दस्तावेज़ अपलोड करें

सबसे पहले, निम्न में से किसी भी तरीके का उपयोग करके पीडीएफ दस्तावेज़ को क्लाउड पर अपलोड करें:

परिणामस्वरूप, पीडीएफ फाइल क्लाउड स्टोरेज पर अपलोड हो जाएगी

डैशबोर्ड पर पीडीएफ फाइल अपलोड की गई

Dashboard.groupdocs.cloud/#/files पर पीडीएफ फाइल अपलोड की गई

अपलोड किए गए पीडीएफ दस्तावेज़ से छवियाँ निकालें

अब आपने पीडीएफ से सभी तस्वीरें निकालने का कठिन काम पूरा कर लिया है। पायथन कोड का पालन करने से आप अपलोड किए गए पीडीएफ दस्तावेज़ से सभी छवियों को तुरंत निकाल सकेंगे।

# पायथन में वर्ड दस्तावेज़, एक्सेल स्प्रेडशीट, प्रेजेंटेशन या पीडीएफ दस्तावेज़ से छवियां कैसे निकालें।
import groupdocs_parser_cloud
class ExtractImagesFromPDF:
    @classmethod  
    def Run(cls):
        # https://dashboard.groupdocs.cloud/ से एपीपी एसआईडी और एपीपी कुंजी प्राप्त करें
        configuration = groupdocs_parser_cloud.Configuration("xxxx-APP-SID-xxx", "xxxx APP KEY xxx")
        configuration.api_base_url = "https://api.groupdocs.cloud"
        parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
        
        options = groupdocs_parser_cloud.ImagesOptions()
        options.file_info = groupdocs_parser_cloud.FileInfo()
        options.file_info.file_path = "documents/doc-with-images.pdf"

        request = groupdocs_parser_cloud.ImagesRequest(options)
        result = parseApi.images(request)
        # निकाली गई छवियों के गुण प्रदर्शित करें
       for image in result.images:
            print("Path: " + image.path)
            print("Download url: " + image.download_url)
            print("Image format: " + image.file_format)
            print("Page index: " + str(image.page_index))

निकाली गई छवियाँ डाउनलोड करें

एक बार जब आप छवियां निकाल लेते हैं, तो आप छवियों को क्लाउड से डैशबोर्ड से या प्रोग्रामेटिक रूप से डाउनलोड कर सकते हैं। यहां दिखाई गई छवियां ऊपर दिखाए गए पीडीएफ दस्तावेज़ से निकाली गई हैं।

छवियाँ एक पीडीएफ फ़ाइल से निकाली गईं

छवियाँ पीडीएफ दस्तावेज़ से निकाली गईं

पायथन का उपयोग करके दस्तावेज़ से छवियाँ निकाली गईं

पीडीएफ, एक्सएलएसएक्स, पीपीटीएक्स या डॉक्स फ़ाइल से उच्च गुणवत्ता वाली छवि निकालें

पायथन का उपयोग करके एक्सेल, पीपीटी, या वर्ड डॉक्स से छवि निकालना

इसी तरह, आप पीडीएफ दस्तावेज़ के लिए सटीक उपर्युक्त पायथन कोड के साथ वर्ड दस्तावेजों, स्प्रेडशीट्स, प्रस्तुतियों से सभी छवियां निकाल सकते हैं। आपको बस एक्सटेंशन के साथ सही दस्तावेज़ नाम के साथ फ़ाइल पथ को बदलना होगा।

# वर्ड दस्तावेज़ों, एक्सेल स्प्रेडशीट्स, पायथन में प्रस्तुतियों से छवियां निकालें।
options.file_info.file_path = "documents/doc-with-images.docx"
# बस आवश्यकता के अनुसार दस्तावेज़ पथ बदलें (doc/docx, xls/xlsx, ppt/pptx, ...)
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

ऑनलाइन दस्तावेज़ से छवियाँ निकालें

फ़ाइल या डॉक्युमेंट से छवियाँ ऑनलाइन मुफ़्त में कैसे निकालें? Groupdocs.Parser ऑनलाइन वर्ड से छवियां निकालने, पीडीएफ से सभी छवियां निकालने, सभी चित्रों को पावरपॉइंट में सहेजने या xlsx पायथन से छवियां निकालने के लिए एक मुफ्त ऑनलाइन टूल प्रदान करता है। बस उस दस्तावेज़ का चयन करें जिसे आप जेपीजी, पीएनजी, जेपीईजी या जीआईएफ छवियां निकालना चाहते हैं।

पीडीएफ से छवियां ऑनलाइन निःशुल्क निकालें, एक्सेल ऑनलाइन से छवियां निकालें, ऑनलाइन वर्ड से छवि निकालें और पीपीटीएक्स ऑनलाइन से छवियां निकालें टूल का उपयोग करके विकसित किया गया है। Groupdocs.Parser पायथन एपीआई।

निष्कर्ष

इस लेख में हमने सीखा है कि पायथन का उपयोग करके वर्ड, एक्सेल, पावरपॉइंट, पीडीएफ और अन्य दस्तावेजों से प्रोग्रामेटिक रूप से छवियां कैसे निकाली जाती हैं। कोड में कोई अंतर नहीं है, हमें बस स्रोत दस्तावेज़ पथ और प्रकार को बदलना होगा।

अधिक सुविधाओं के लिए और दस्तावेज़ पार्सिंग एपीआई के बारे में अधिक जानने के लिए, उन लेखों के लिए दस्तावेज़ीकरण पर जाएँ जिनमें उदाहरण भी शामिल हैं। हाइलाइट की गई सुविधाओं का परीक्षण करने का सबसे अच्छा तरीका GitHub से ओपन-सोर्स रनिंग उदाहरणों का अनुभव करना है। किसी भी भ्रम की स्थिति में, ग्रुपडॉक्स सपोर्ट टीम को आपकी सुविधा प्रदान करने में खुशी महसूस होती है। धन्यवाद

प्रश्न पूछें

यदि आपके पास पायथन का उपयोग करके पीडीएफ, एक्सएलएसएक्स, पीपीटीएक्स या वर्ड डॉक्स से छवियां निकालने के बारे में कोई प्रश्न है, तो कृपया बेझिझक हमसे फ्री सपोर्ट फोरम पर पूछें। )

यह सभी देखें