आपको अपने PDF या Word दस्तावेज़ों का पुन: उपयोग करने के लिए छवियों को निकालने की आवश्यकता हो सकती है। आप क्लाउड पर प्रोग्रामेटिक रूप से PDF दस्तावेज़ों से छवियों को आसानी से निकाल सकते हैं। यह लेख समझाएगा कि पायथन में REST API का उपयोग करके PDF दस्तावेज़ों से चित्र कैसे निकाले जाएँ।
इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:
- दस्तावेज़ पार्सर रेस्ट एपीआई और पायथन एसडीके
- REST API का उपयोग करके PDF से छवियाँ निकालें
- REST API का उपयोग करके पेज नंबर रेंज द्वारा इमेज सेव करें
- REST API का उपयोग करके संलग्न दस्तावेज़ से चित्र प्राप्त करें
दस्तावेज़ पार्सर रेस्ट एपीआई और पायथन एसडीके
एक पीडीएफ दस्तावेज़ से छवियों को निकालने के लिए, मैं ग्रुपडॉक्स के पायथन एसडीके। पार्सर क्लाउड एपीआई का उपयोग करूंगा। यह आपको सभी लोकप्रिय दस्तावेज़ प्रकारों से डेटा पार्स करने की अनुमति देता है। आप एसडीके का उपयोग कर टेम्पलेट द्वारा टेक्स्ट, इमेज और डेटा पार्स कर सकते हैं। यह क्लाउड एपीआई के लिए अपने दस्तावेज़ पार्सर परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby और Node.js SDK भी प्रदान करता है।
आप कंसोल में निम्न आदेश का उपयोग करके पाइप (पायथन के लिए पैकेज इंस्टॉलर) के साथ अपने पायथन प्रोजेक्ट में GroupDocs.Parser क्लाउड स्थापित कर सकते हैं:
pip install groupdocs_parser_cloud
चरणों और उपलब्ध कोड उदाहरणों का पालन शुरू करने से पहले कृपया डैशबोर्ड से अपनी क्लाइंट आईडी और क्लाइंट सीक्रेट प्राप्त करें। एक बार आपके पास अपनी क्लाइंट आईडी और सीक्रेट होने के बाद, नीचे दिखाए गए अनुसार कोड जोड़ें:
client_id = "112f0f38-9dae-42d5-b4fc-cc84ae644972"
client_secret = "16ad3fe0bdc39c910f57d2fd48a5d618"
configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
पायथन में REST API का उपयोग करके PDF से चित्र निकालें
आप नीचे बताए गए सरल चरणों का पालन करके पीडीएफ दस्तावेज़ों से छवियां निकाल सकते हैं:
- अपलोड क्लाउड पर पीडीएफ फाइल
- पायथन का उपयोग करके PDF दस्तावेज़ों से चित्र निकालें
- डाउनलोड करना the extracted images
दस्तावेज़ अपलोड करें
सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके PDF दस्तावेज़ को क्लाउड पर अपलोड करें:
# एपीआई आरंभीकरण
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
request = groupdocs_parser_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)
परिणामस्वरूप, अपलोड की गई PDF फ़ाइल (sample.pdf) क्लाउड पर आपके डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।
पायथन का उपयोग करके पीडीएफ दस्तावेज़ से सभी छवियां निकालें
आप नीचे बताए गए चरणों का पालन करके आसानी से पीडीएफ फाइल से सभी छवियों को प्रोग्रामेटिक रूप से निकाल सकते हैं।
- ParseApi का एक उदाहरण बनाएँ
- ImageOptions को परिभाषित करें
- पीडीएफ फाइल के लिए पथ सेट करें
- इमेज रिक्वेस्ट बनाएं
- ParseApi.images() विधि को कॉल करके परिणाम प्राप्त करें
निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से सभी छवियों को कैसे निकाला जाए।
# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
for image in result.images:
print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
निकाली गई छवियां डाउनलोड करें
उपरोक्त कोड नमूना क्लाउड पर निकाली गई छवियों को सहेजेगा। आप नीचे दिए गए कोड नमूने का उपयोग करके इन छवियों को डाउनलोड कर सकते हैं:
# एपीआई आरंभीकरण
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
# छवि डाउनलोड करें
request = groupdocs_parser_cloud.DownloadFileRequest(image.path, my_storage)
response = file_api.download_file(request)
# डाउनलोड की गई फ़ाइल को अपनी कार्यशील निर्देशिका में ले जाएँ
shutil.move(response, "C:\\Files\\Images")
पायथन का उपयोग करके पीडीएफ दस्तावेज़ों से पृष्ठ संख्या द्वारा चित्र सहेजें
आप नीचे बताए गए चरणों का पालन करके आसानी से पीडीएफ फाइल के विशिष्ट पृष्ठों से छवियों को प्रोग्रामेटिक रूप से निकाल सकते हैं।
- ParseApi का एक उदाहरण बनाएँ
- ImageOptions को परिभाषित करें
- पीडीएफ फाइल को पथ प्रदान करें
- प्रारंभ पृष्ठ संख्या सेट करें
- निकालने के लिए पृष्ठों की संख्या निर्धारित करें
- इमेज रिक्वेस्ट बनाएं
- ParseApi.images() पद्धति को कॉल करके परिणाम प्राप्त करें
निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ से पृष्ठ संख्या श्रेणी द्वारा छवियों को कैसे निकाला जाए। निकाली गई छवियों को डाउनलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।
# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# पृष्ठ श्रेणी परिभाषित करें
options.start_page_number = 1
options.count_pages_to_extract = 1
# अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
for page in result.pages:
print("Images from " + str(page.page_index) + " page.")
for image in page.images:
print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
पायथन का उपयोग करके पीडीएफ के साथ संलग्न दस्तावेज़ से चित्र प्राप्त करें
आप नीचे दिए गए चरणों का पालन करके प्रोग्रामेटिक रूप से एक पीडीएफ फाइल में अटैचमेंट के रूप में उपलब्ध एक कंटेनर के अंदर एक दस्तावेज़ से छवियों को निकाल सकते हैं।
- ParseApi का एक उदाहरण बनाएँ
- ImageOptions को परिभाषित करें
- पीडीएफ फाइल के लिए पथ सेट करें
- कंटेनरआइटमइन्फो को परिभाषित करें
- अंदर के दस्तावेज़ का सापेक्ष पथ प्रदान करें
- प्रारंभ पृष्ठ संख्या सेट करें
- निकालने के लिए पृष्ठों की संख्या निर्धारित करें
- इमेज रिक्वेस्ट बनाएं
- ParseApi.images() विधि को कॉल करके परिणाम प्राप्त करें
निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके PDF दस्तावेज़ के अंदर दस्तावेज़ से छवियों को कैसे निकाला जाए। निकाली गई छवियों को डाउनलोड करने के लिए कृपया पहले बताए गए चरणों का पालन करें।
# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "PDF_with_attachements.pdf"
options.file_info.password = "password"
# कंटेनर आइटम सेट करें
container_info = groupdocs_parser_cloud.ContainerItemInfo()
container_info.relative_path = "template-document.pdf"
options.container_item_info = container_info
# पृष्ठ श्रेणी परिभाषित करें
options.start_page_number = 2
options.count_pages_to_extract = 1
# अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
for page in result.pages:
print("Images from " + str(page.page_index) + " page.")
for image in page.images:
print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
ऑनलाइन प्रयास करें
कृपया निम्नलिखित मुफ्त ऑनलाइन पीडीएफ पार्सिंग टूल का प्रयास करें, जिसे उपरोक्त एपीआई का उपयोग करके विकसित किया गया है। https://products.groupdocs.app/parser/pdf
निष्कर्ष
इस लेख में, आपने क्लाउड पर PDF दस्तावेज़ों से छवियों को निकालने का तरीका सीखा है। इस लेख में यह भी बताया गया है कि क्लाउड पर पीडीएफ फाइल को प्रोग्रामेटिक रूप से कैसे अपलोड किया जाए। आपने यह भी सीखा कि SDK का उपयोग करके निकाली गई छवियों को कैसे डाउनलोड किया जाता है। आप दस्तावेज़ का उपयोग करके GroupDocs.Parser Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है। किसी भी अस्पष्टता के मामले में, कृपया बेझिझक हमसे फोरम पर संपर्क करें।