यदि आप एक पायथन डेवलपर हैं और दस्तावेजों से डेटा निकालना चाहते हैं, तो यह लेख आपको सरल पायथन उदाहरणों का उपयोग करके विभिन्न वर्ड प्रोसेसिंग दस्तावेजों, स्प्रेडशीट, प्रस्तुतियों और पीडीएफ दस्तावेजों से छवियां निकालने के लिए मार्गदर्शन करेगा।
आज निम्नलिखित विषयों को कवर किया जाएगा:
- इमेज एक्सट्रैक्शन REST API और पायथन SDK
- पायथन का उपयोग करके पीडीएफ दस्तावेज़ से छवियां निकालें
- पायथन का उपयोग करके एक्सेल, पीपीटी, या वर्ड डॉक्स से छवियाँ निकालना
इमेज एक्सट्रैक्शन REST API और पायथन SDK
इस बार, हम विभिन्न प्रकार के दस्तावेजों से छवियों को निकालने के लिए GroupDocs.Parser Cloud API के पायथन एसडीके का उपयोग करेंगे। हालाँकि, वर्तमान में, यह क्लाउड एपीआई के लिए दस्तावेज़ पार्सिंग परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby और Node.js SDK भी प्रदान करता है।
एपीआई वर्ड प्रोसेसिंग दस्तावेज़, स्प्रेडशीट, प्रेजेंटेशन, ईमेल, अभिलेखागार, मार्कअप और पीडीएफ दस्तावेजों जैसे विभिन्न प्रकार के दस्तावेज़ों से छवियां निकालने के साथ-साथ टेक्स्ट और मेटाडेटा निष्कर्षण का भी समर्थन करता है।
उद्देश्य पर आते हुए, सबसे पहले, चरणों और उपलब्ध कोड उदाहरणों का पालन शुरू करने से पहले डैशबोर्ड से अपनी एपीपी कुंजी और एपीपी एसआईडी प्राप्त करें।
पायथन का उपयोग करके पीडीएफ से छवियाँ निकालें
उदाहरण के तौर पर, सबसे पहले मैं एक पीडीएफ दस्तावेज़ से छवियां निकालूंगा। केवल सरल चरणों का पालन करके, सभी छवियां आसानी से निकाली जा सकती हैं।
- पीडीएफ दस्तावेज़ को क्लाउड पर अपलोड करें।
- अपलोड किए गए दस्तावेज़ से छवियाँ निकालें।
- निकाले गए चित्र डाउनलोड करें.
पीडीएफ दस्तावेज़ अपलोड करें
सबसे पहले, निम्न में से किसी भी तरीके का उपयोग करके पीडीएफ दस्तावेज़ को क्लाउड पर अपलोड करें:
- डैशबोर्ड का उपयोग करना।
- ब्राउज़र से अपलोड फ़ाइल एपीआई का उपयोग करना।
- प्रोग्रामेटिक रूप से जैसा कि दस्तावेज़ीकरण में बताया गया है।
परिणामस्वरूप, पीडीएफ फाइल क्लाउड स्टोरेज पर अपलोड हो जाएगी
अपलोड किए गए पीडीएफ दस्तावेज़ से छवियाँ निकालें
अब आपने पीडीएफ से सभी तस्वीरें निकालने का कठिन काम पूरा कर लिया है। पायथन कोड का पालन करने से आप अपलोड किए गए पीडीएफ दस्तावेज़ से सभी छवियों को तुरंत निकाल सकेंगे।
# पायथन में वर्ड दस्तावेज़, एक्सेल स्प्रेडशीट, प्रेजेंटेशन या पीडीएफ दस्तावेज़ से छवियां कैसे निकालें।
import groupdocs_parser_cloud
class ExtractImagesFromPDF:
@classmethod
def Run(cls):
# https://dashboard.groupdocs.cloud/ से एपीपी एसआईडी और एपीपी कुंजी प्राप्त करें
configuration = groupdocs_parser_cloud.Configuration("xxxx-APP-SID-xxx", "xxxx APP KEY xxx")
configuration.api_base_url = "https://api.groupdocs.cloud"
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "documents/doc-with-images.pdf"
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
# निकाली गई छवियों के गुण प्रदर्शित करें
for image in result.images:
print("Path: " + image.path)
print("Download url: " + image.download_url)
print("Image format: " + image.file_format)
print("Page index: " + str(image.page_index))
निकाली गई छवियाँ डाउनलोड करें
एक बार जब आप छवियां निकाल लेते हैं, तो आप छवियों को क्लाउड से डैशबोर्ड से या प्रोग्रामेटिक रूप से डाउनलोड कर सकते हैं। यहां दिखाई गई छवियां ऊपर दिखाए गए पीडीएफ दस्तावेज़ से निकाली गई हैं।
पायथन का उपयोग करके एक्सेल, पीपीटी, या वर्ड डॉक्स से छवि निकालना
इसी तरह, आप पीडीएफ दस्तावेज़ के लिए सटीक उपर्युक्त पायथन कोड के साथ वर्ड दस्तावेजों, स्प्रेडशीट्स, प्रस्तुतियों से सभी छवियां निकाल सकते हैं। आपको बस एक्सटेंशन के साथ सही दस्तावेज़ नाम के साथ फ़ाइल पथ को बदलना होगा।
# वर्ड दस्तावेज़ों, एक्सेल स्प्रेडशीट्स, पायथन में प्रस्तुतियों से छवियां निकालें।
options.file_info.file_path = "documents/doc-with-images.docx"
# बस आवश्यकता के अनुसार दस्तावेज़ पथ बदलें (doc/docx, xls/xlsx, ppt/pptx, ...)
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
ऑनलाइन दस्तावेज़ से छवियाँ निकालें
फ़ाइल या डॉक्युमेंट से छवियाँ ऑनलाइन मुफ़्त में कैसे निकालें? Groupdocs.Parser ऑनलाइन वर्ड से छवियां निकालने, पीडीएफ से सभी छवियां निकालने, सभी चित्रों को पावरपॉइंट में सहेजने या xlsx पायथन से छवियां निकालने के लिए एक मुफ्त ऑनलाइन टूल प्रदान करता है। बस उस दस्तावेज़ का चयन करें जिसे आप जेपीजी, पीएनजी, जेपीईजी या जीआईएफ छवियां निकालना चाहते हैं।
पीडीएफ से छवियां ऑनलाइन निःशुल्क निकालें, एक्सेल ऑनलाइन से छवियां निकालें, ऑनलाइन वर्ड से छवि निकालें और पीपीटीएक्स ऑनलाइन से छवियां निकालें टूल का उपयोग करके विकसित किया गया है। Groupdocs.Parser पायथन एपीआई।
निष्कर्ष
इस लेख में हमने सीखा है कि पायथन का उपयोग करके वर्ड, एक्सेल, पावरपॉइंट, पीडीएफ और अन्य दस्तावेजों से प्रोग्रामेटिक रूप से छवियां कैसे निकाली जाती हैं। कोड में कोई अंतर नहीं है, हमें बस स्रोत दस्तावेज़ पथ और प्रकार को बदलना होगा।
अधिक सुविधाओं के लिए और दस्तावेज़ पार्सिंग एपीआई के बारे में अधिक जानने के लिए, उन लेखों के लिए दस्तावेज़ीकरण पर जाएँ जिनमें उदाहरण भी शामिल हैं। हाइलाइट की गई सुविधाओं का परीक्षण करने का सबसे अच्छा तरीका GitHub से ओपन-सोर्स रनिंग उदाहरणों का अनुभव करना है। किसी भी भ्रम की स्थिति में, ग्रुपडॉक्स सपोर्ट टीम को आपकी सुविधा प्रदान करने में खुशी महसूस होती है। धन्यवाद
प्रश्न पूछें
यदि आपके पास पायथन का उपयोग करके पीडीएफ, एक्सएलएसएक्स, पीपीटीएक्स या वर्ड डॉक्स से छवियां निकालने के बारे में कोई प्रश्न है, तो कृपया बेझिझक हमसे फ्री सपोर्ट फोरम पर पूछें। )
यह सभी देखें
- पीडीएफ से सभी छवियां निकालें और Node.js का उपयोग करके ऑनलाइन पीडीएफ से छवियां निकालें
- पीडीएफ से स्वचालित डेटा निष्कर्षण और ऑनलाइन पीडीएफ पायथन से डेटा निकालें
- पीडीएफ पायथन से छवियां निकालें और पायथन का उपयोग करके पीडीएफ एक्रोबैट से छवियां निकालें
- Node.js में REST API का उपयोग करके वर्ड दस्तावेज़ से विशिष्ट डेटा कैसे निकालें
- पीडीएफ से डेटा निकालें जावास्क्रिप्ट और पीडीएफ से डेटा निकालने के लिए सर्वोत्तम प्रोग्रामिंग भाषा
- पायथन में REST API का उपयोग करके वर्ड दस्तावेज़ पायथन से तालिकाएँ निकालें