मुफ़्त ऑनलाइन DOCX पार्सर को DOCX या DOC से टेक्स्ट, चित्र और चित्र निकालने के लिए डिज़ाइन किया गया है।

पायथन में REST API का उपयोग करके पार्स वर्ड डॉक्यूमेंट

विभिन्न मामलों में, हमें Word दस्तावेज़ों को पार्स करने और छवियों या पाठ को निकालने की आवश्यकता हो सकती है। Word दस्तावेज़ों से छवियों और पाठ का निष्कर्षण पाठ का विश्लेषण करने, पुन: उपयोग करने या उन्हें अन्य दस्तावेज़ों में संयोजित करने में सहायक हो सकता है। हम DOC या DOCX फ़ाइलों को आसानी से पार्स कर सकते हैं और क्लाउड पर सभी छवियों/पाठ को प्रोग्रामेटिक रूप से निकाल सकते हैं। इस लेख में, हम सीखेंगे कि पायथन में REST API का उपयोग करके Word दस्तावेज़ों को कैसे पार्स किया जाए।

इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:

वर्ड डॉक्यूमेंट पार्सर रेस्ट एपीआई और पायथन एसडीके

Word दस्तावेज़ों को पार्स करने के लिए, हम GroupDocs.Parser Cloud के Python SDK API का उपयोग करेंगे। दस्तावेज़ को पार्स करने के लिए कृपया इसे कंसोल में निम्न आदेश का उपयोग करके इंस्टॉल करें:

pip install groupdocs_parser_cloud

कृपया उल्लिखित चरणों का पालन करने से पहले डैशबोर्ड से अपनी क्लाइंट आईडी और सीक्रेट प्राप्त करें। एक बार आपके पास अपनी आईडी और रहस्य होने के बाद, नीचे दिखाए गए कोड में जोड़ें:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

पायथन में REST API का उपयोग करके Word दस्तावेज़ों को पार्स करें और छवियां निकालें

हम नीचे दिए गए चरणों का पालन करके वर्ड दस्तावेज़ों को पार्स कर सकते हैं और छवियों को प्रोग्रामेटिक रूप से निकाल सकते हैं:

दस्तावेज़ अपलोड करें

सबसे पहले, हम नीचे दिए गए कोड उदाहरण का उपयोग करके वर्ड डॉक्यूमेंट (DOCX) को क्लाउड पर अपलोड करेंगे:

# एपीआई का उदाहरण बनाएँ
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# अपलोड फ़ाइल अनुरोध बनाएँ
request = groupdocs_parser_cloud.UploadFileRequest("sample.docx", "C:\\Files\\parser\\sample.docx", my_storage)

# फ़ाइल अपलोड करें
response = file_api.upload_file(request)

परिणामस्वरूप, अपलोड की गई DOCX फ़ाइल क्लाउड पर डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।

पायथन का उपयोग करके Word दस्तावेज़ों से चित्र निकालें

हम नीचे दिए गए चरणों का पालन करके प्रोग्रामेटिक रूप से Word दस्तावेज़ों से सभी छवियों को आसानी से निकाल सकते हैं।

  • सबसे पहले, ParseApi का एक उदाहरण बनाएँ।
  • अगला, FileInfo का एक उदाहरण बनाएँ।
  • फिर, इनपुट DOCX फ़ाइल के लिए पथ सेट करें।
  • अगला, ImageOptions का एक उदाहरण बनाएँ।
  • फिर, ImageOptions को FileInfo असाइन करें।
  • उसके बाद, ImageOptions के साथ तर्क के रूप में ImagesRequest बनाएं।
  • अंत में, ImageRequest के साथ ParseApi.images() विधि को कॉल करके छवियां निकालें।

निम्न कोड नमूना दिखाता है कि पायथन में दस्तावेज़ पार्सिंग REST API का उपयोग करके DOCX फ़ाइल से छवियों को कैसे निकाला जाए।

# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# छवि विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.docx"

# चित्र अनुरोध बनाएँ
request = groupdocs_parser_cloud.ImagesRequest(options)

# चित्र प्राप्त करें
result = parseApi.images(request)
Word DOCX को पार्स करें और अजगर पार्स शब्द docx का उपयोग करके छवियां निकालें

पायथन में वर्ड पार्सर ऑनलाइन रेस्ट एपीआई का उपयोग करके वर्ड डॉक्यूमेंट्स को पार्स करें और इमेज निकालें।

निकाली गई छवियां डाउनलोड करें

उपरोक्त कोड नमूना निकाली गई छवियों को क्लाउड पर शब्द फ़ाइल पार्सर के साथ सहेजेगा। हम नीचे दिए गए कोड उदाहरण का उपयोग करके इन छवियों को डाउनलोड कर सकते हैं:

# एपीआई आरंभीकरण
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
folder_api = groupdocs_parser_cloud.FolderApi.from_config(configuration)

# फाइलों की सूची प्राप्त करें
request = groupdocs_parser_cloud.GetFilesListRequest("parser/images/sample_docx/", my_storage);
response = folder_api.get_files_list(request)

# छवियों को एक-एक करके डाउनलोड करें
for data in response.value:
    # डाउनलोड फ़ाइल अनुरोध बनाएँ
    request = groupdocs_parser_cloud.DownloadFileRequest(data.path, my_storage)
    # डाउनलोड फ़ाइल
    response = file_api.download_file(request)
    # डाउनलोड की गई फ़ाइल को अपनी कार्यशील निर्देशिका में ले जाएँ
    shutil.move(response, "C:\\Files\\parser\\")

पायथन में REST API का उपयोग करके Word दस्तावेज़ों से टेक्स्ट निकालें

हम नीचे दिए गए चरणों का पालन करके प्रोग्रामेटिक रूप से वर्ड दस्तावेज़ों से सभी पाठ आसानी से निकाल सकते हैं।

  • सबसे पहले, ParseApi का एक उदाहरण बनाएँ।
  • अगला, FileInfo का एक उदाहरण बनाएँ।
  • फिर, इनपुट DOCX फ़ाइल के लिए पथ सेट करें।
  • अगला, टेक्स्टऑप्शन का एक उदाहरण बनाएं।
  • फिर, FileInfo को TextOptions को असाइन करें।
  • उसके बाद, TextRequest को TextOptions के साथ तर्क के रूप में बनाएँ।
  • अंत में, ParseApi.text() विधि को TextRequest के साथ कॉल करके परिणाम प्राप्त करें।

निम्न कोड उदाहरण दिखाता है कि docx पार्सर REST API का उपयोग करके DOCX फ़ाइल से टेक्स्ट कैसे निकाला जाए।

# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# पाठ विकल्पों को परिभाषित करें
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.docx"

# पाठ अनुरोध बनाएँ
request = groupdocs_parser_cloud.TextRequest(options)

# पाठ प्राप्त करें
result = parseApi.text(request)
print("Text: " + result.text)
पायथन में REST API का उपयोग करके Word दस्तावेज़ DOCX से टेक्स्ट निकालें

पायथन में REST API का उपयोग करके Word दस्तावेज़ों से टेक्स्ट निकालें।

ऑनलाइन प्रयास करें

दस्तावेज़ पार्सिंग सॉफ़्टवेयर का ऑनलाइन निःशुल्क उपयोग कैसे करें? कृपया निम्नलिखित नि:शुल्क ऑनलाइन DOCX पार्सिंग टूल का प्रयास करें, जिसे ऊपर दिए गए पार्स शब्द दस्तावेज़ पायथन एपीआई का उपयोग करके विकसित किया गया है। https://products.groupdocs.app/parser/docx

निष्कर्ष

इस लेख में, हमने सीखा है कि क्लाउड पर वर्ड पार्सर का उपयोग करके वर्ड दस्तावेज़ों को कैसे पार्स किया जाए। हमने यह भी देखा है कि पार्स डॉक्स पायथन का उपयोग करके DOCX फ़ाइलों से चित्र और पाठ कैसे निकाले जाते हैं। इस लेख में यह भी बताया गया है कि क्लाउड पर DOCX फ़ाइल को प्रोग्रामेटिक रूप से कैसे अपलोड किया जाए और क्लाउड से निकाली गई छवियों को कैसे डाउनलोड किया जाए। इसके अलावा, आप दस्तावेज़ का उपयोग करके GroupDocs.Parser Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई को देखने और बातचीत करने देता है। दस्तावेज़ पार्सिंग और फ़ाइलों को पार्स करने के बारे में किसी भी अस्पष्टता के मामले में, कृपया बेझिझक हमसे फोरम पर संपर्क करें।

यह सभी देखें