एक्सएमएल(एक्स्टेंसिबल मार्कअप लैंग्वेज) संरचित जानकारी को संग्रहीत करने और आदान-प्रदान करने के लिए एक लोकप्रिय डेटा प्रारूप है। इसका उपयोग वेब डेवलपमेंट, डेटा स्टोरेज और डेटा ट्रांसफर सहित विभिन्न डोमेन में व्यापक रूप से किया जाता है। XML फ़ाइलों से टेक्स्ट निकालना कई कारणों से महत्वपूर्ण है। यह हमें XML दस्तावेज़ों में मौजूद वास्तविक डेटा तक पहुंचने और उसमें हेरफेर करने की अनुमति देता है। टेक्स्ट निकालकर, हम विभिन्न ऑपरेशन कर सकते हैं, जैसे डेटा विश्लेषण, डेटा परिवर्तन और डेटा एकीकरण। इस लेख में, हम यह पता लगाएंगे कि REST API का उपयोग करके पायथन में XML से टेक्स्ट कैसे निकाला जाए।
इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:
- XML दस्तावेज़ और SDK इंस्टालेशन को पार्स करने के लिए Python REST API
- REST API का उपयोग करके पायथन में XML फ़ाइल से सभी टेक्स्ट निकालें
XML दस्तावेज़ और SDK इंस्टालेशन को पार्स करने के लिए Python REST API
GroupDocs.Parser Cloud SDK for Python एक शक्तिशाली उपकरण है जो XML और अन्य फ़ाइल स्वरूपों से पाठ के निष्कर्षण को सरल बनाता है। यह दस्तावेज़ पार्सिंग, टेक्स्ट निष्कर्षण, मेटाडेटा निष्कर्षण और कई अन्य सहित सुविधाओं की एक विस्तृत श्रृंखला प्रदान करता है। इसके सहज ज्ञान युक्त एपीआई के साथ, डेवलपर्स आसानी से अपने पायथन अनुप्रयोगों में पाठ निष्कर्षण क्षमताओं को एकीकृत कर सकते हैं। यह क्लाउड एपीआई के लिए दस्तावेज़ पार्सर परिवार के सदस्यों के रूप में C# .NET, Java, PHP, Ruby और Node.js SDK का भी समर्थन करता है। एसडीके को आपकी विकास प्रक्रिया को सरल बनाने और उत्पादकता बढ़ाने के लिए पायथन-आधारित एप्लिकेशन में एकीकृत किया जा सकता है।
XML से जानकारी निकालने के लिए कंसोल में निम्नलिखित कमांड का उपयोग करके पाइप (पायथन के लिए पैकेज इंस्टॉलर) के साथ अपने पायथन प्रोजेक्ट में GroupDocs.Parser क्लाउड स्थापित करें:
pip install groupdocs_parser_cloud
अब, कृपया डैशबोर्ड से अपनी क्लाइंट आईडी और क्लाइंट सीक्रेट प्राप्त करें और नीचे दिखाए अनुसार कोड जोड़ें:
# ग्रुपडॉक्स पार्सर एसडीके आयात करें
import groupdocs_parser_cloud
# निःशुल्क पंजीकरण के बाद https://dashboard.groupdocs.cloud से ऐप_सिड और ऐप_की प्राप्त करें।
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# फ़ाइल API कॉन्फ़िगरेशन प्राप्त करें.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
REST API का उपयोग करके पायथन में XML फ़ाइल से सभी टेक्स्ट निकालें
Python के लिए GroupDocs.Parser Cloud SDK का उपयोग करके Python में XML दस्तावेज़ों से टेक्स्ट निकालने के लिए, इन चरणों का पालन करें:
- अपलोड करें XML फ़ाइल को क्लाउड पर
- निकालें पायथन का उपयोग करके XML से सभी पाठ
फ़ाइल अपलोड करें
सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके XML दस्तावेज़ को क्लाउड पर अपलोड करें:
# फ़ाइल एपीआई का एक उदाहरण बनाएं
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
# अपलोड फ़ाइल अनुरोध को कॉल करें
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# फ़ाइल को क्लाउड पर अपलोड करें
response = file_api.upload_file(request)
print(response.uploaded)
परिणामस्वरूप, अपलोड की गई XML फ़ाइल क्लाउड पर आपके डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।
Python का उपयोग करके XML डेटा से सभी टेक्स्ट निकालें
इस अनुभाग में, हम चरण और एक उदाहरण कोड स्निपेट लिखेंगे जो दर्शाता है कि Python के लिए GroupDocs.Parser Cloud SDK का उपयोग करके Python में XML दस्तावेज़ से टेक्स्ट कैसे निकाला जाए:
- सबसे पहले, ParseApi वर्ग का एक उदाहरण बनाएं।
- दूसरे, TextOptions() वर्ग का एक उदाहरण बनाएं।
- तीसरा, FileInfo वर्ग का एक उदाहरण बनाएं।
- और, इसे टेक्स्ट विकल्प फ़ाइलइन्फो विधि पर असाइन करें।
- इसके बाद, इनपुट के रूप में XML फ़ाइल का पथ सेट करें।
- अब, TextRequest() क्लास का एक उदाहरण बनाएं और TextOptions पैरामीटर पास करें।
- अंत में, ParseApi.text() विधि को कॉल करके और TextRequest पैरामीटर पास करके परिणाम प्राप्त करें।
निम्नलिखित कोड नमूना दिखाता है कि REST API का उपयोग करके पायथन में XML दस्तावेज़ से टेक्स्ट कैसे निकाला जाए:
# REST API का उपयोग करके Python में XML से टेक्स्ट कैसे निकालें
try:
# एपीआई आरंभीकरण
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# पाठ विकल्प परिभाषित करें
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "python-testing/input-sample-file.xml"
request = groupdocs_parser_cloud.TextRequest(options)
result = parseApi.text(request)
print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
आप नीचे दी गई छवि में आउटपुट देख सकते हैं:
निःशुल्क ऑनलाइन दस्तावेज़ पार्सर
XML से मुफ़्त में ऑनलाइन टेक्स्ट कैसे निकालें? कृपया XML फ़ाइलों से डेटा निकालने के लिए ऑनलाइन XML पार्सर सॉफ़्टवेयर आज़माएँ। यह XML पार्सर टूल उपर्युक्त पायथन पार्सर लाइब्रेरी का उपयोग करके विकसित किया गया है।
निष्कर्ष
अंत में, XML डेटा के साथ काम करते समय XML फ़ाइलों से टेक्स्ट निकालना एक मौलिक कार्य है। Python, GroupDocs.Parser Cloud SDK के साथ मिलकर, XML फ़ाइलों से टेक्स्ट निकालने के लिए एक विश्वसनीय और कुशल समाधान प्रदान करता है। इस लेख से आपने निम्नलिखित सीखा है:
- REST API का उपयोग करके Python में XML दस्तावेज़ों से सभी टेक्स्ट कैसे निकालें;
- पायथन का उपयोग करके प्रोग्रामेटिक रूप से एक XML फ़ाइल को क्लाउड पर अपलोड करें;
- और XML दस्तावेज़ों को पार्स करने के लिए ऑनलाइन XML डेटा निष्कर्षण सॉफ़्टवेयर।
इसके अलावा, आप दस्तावेज़ीकरण का उपयोग करके GroupDocs.Parser क्लाउड एपीआई के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको ब्राउज़र के माध्यम से सीधे हमारे एपीआई को देखने और उनके साथ बातचीत करने की सुविधा देता है। पायथन एसडीके का संपूर्ण स्रोत कोड जीथूब पर निःशुल्क उपलब्ध है।
अंत में, हम विभिन्न फ़ाइल स्वरूपों पर नए ब्लॉग लेख लिखते रहते हैं और REST API का उपयोग करके पार्सिंग करते रहते हैं। तो कृपया नवीनतम अपडेट के लिए संपर्क करें।
प्रश्न पूछें
यदि आपके पास XML दस्तावेज़ पार्सर के बारे में कोई प्रश्न या भ्रम है, तो कृपया बेझिझक हमारे फोरम के माध्यम से हमसे संपर्क करें।
पूछे जाने वाले प्रश्न
हमें XML फ़ाइलों से टेक्स्ट निकालने की आवश्यकता क्यों है?
XML फ़ाइलों से टेक्स्ट निकालने से हमें XML दस्तावेज़ों में मौजूद वास्तविक डेटा तक पहुँचने और उसमें हेरफेर करने की अनुमति मिलती है।
मैं पायथन का उपयोग करके XML फ़ाइलों से टेक्स्ट कैसे निकाल सकता हूँ?
आप GroupDocs.Parser Cloud SDK for Python का उपयोग करके XML फ़ाइलों से टेक्स्ट निकाल सकते हैं, जो शक्तिशाली टेक्स्ट निष्कर्षण क्षमताएं प्रदान करता है।
क्या Python के लिए GroupDocs.Parser Cloud SDK का उपयोग करके XML फ़ाइलों से मेटाडेटा निकालना संभव है?
हाँ, GroupDocs.Parser Cloud SDK for Python XML फ़ाइलों से मेटाडेटा निकालने का समर्थन करता है। आप मेटाडेटा जानकारी जैसे लेखक, निर्माण तिथि, संशोधन तिथि और बहुत कुछ पुनः प्राप्त कर सकते हैं।
क्या मैं Python के लिए GroupDocs.Parser Cloud SDK का उपयोग करके XML फ़ाइलों में एम्बेड की गई छवियां निकाल सकता हूं?
हाँ, GroupDocs.Parser Cloud SDK for Python आपको XML फ़ाइलों में एम्बेडेड छवियों को निकालने और उन्हें विभिन्न प्रारूपों में परिवर्तित करने की अनुमति देता है।
यह सभी देखें
यहां कुछ संबंधित लेख दिए गए हैं जो आपके लिए उपयोगी हो सकते हैं:
- दस्तावेज़ पार्सिंग - जावा में पीडीएफ फ़ाइल से टेक्स्ट निकालें
- Node.js में REST API का उपयोग करके PDF से डेटा निकालें
- पायथन में REST API का उपयोग करके वर्ड दस्तावेज़ों को पार्स करें
- पायथन का उपयोग करके पीडीएफ दस्तावेज़ों से छवियां निकालें
- पायथन का उपयोग करके पीडीएफ से टेक्स्ट कैसे निकालें
- पायथन का उपयोग करके पीडीएफ से विशिष्ट डेटा निकालें
- जावा डोम पार्सर - जावा का उपयोग करके XML दस्तावेज़ों से टेक्स्ट निकालें