Java DOM Parser - Java का उपयोग करके XML दस्तावेज़ों से टेक्स्ट निकालें।

आज के डिजिटल युग में, एक्सएमएल(एक्सटेंसिबल मार्कअप लैंग्वेज) दस्तावेजों से डेटा निष्कर्षण विभिन्न उद्योगों और अनुप्रयोगों में महत्वपूर्ण भूमिका निभाता है। XML एक लोकप्रिय मार्कअप भाषा है जिसका उपयोग पदानुक्रमित प्रारूप में संरचित डेटा को संग्रहीत और व्यवस्थित करने के लिए किया जाता है। डेटा पर डेटा विश्लेषण और सूचना पुनर्प्राप्ति संचालन करने के लिए व्यवसायों के लिए XML दस्तावेज़ों से जानकारी निकालना आवश्यक है। इस लेख में, हम जावा के लिए GroupDocs.Parser Cloud SDK का उपयोग करके जावा में XML दस्तावेज़ों से टेक्स्ट निकालने का तरीका जानेंगे।

इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:

XML फ़ाइल और SDK इंस्टॉलेशन को पार्स करने के लिए Java REST API

GroupDocs.Parser Cloud SDK for Java एक शक्तिशाली, उपयोगकर्ता के अनुकूल और XML सहित विभिन्न दस्तावेज़ प्रारूपों से आसानी से पाठ निकालने के लिए व्यापक समाधान है। इसके व्यापक एपीआई के साथ, आप आसानी से 50 से अधिक दस्तावेज़ प्रारूप से पाठ, मेटाडेटा, चित्र और अन्य जानकारी निकाल सकते हैं। एसडीके को आपकी विकास प्रक्रिया को सरल बनाने और उत्पादकता बढ़ाने के लिए जावा-आधारित एप्लिकेशन में एकीकृत किया जा सकता है।

आप या तो डाउनलोड एपीआई की जेएआर फ़ाइल कर सकते हैं या इसे अपने प्रोजेक्ट की पोम.एक्सएमएल फ़ाइल में निम्नलिखित रिपोजिटरी और निर्भरता जोड़कर मेवेन का उपयोग करके इंस्टॉल कर सकते हैं:

मावेन रिपोजिटरी:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

मावेन निर्भरता:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

अब, आपको साइन अप एक नि: शुल्क परीक्षण खाते के लिए या सदस्यता योजना खरीदना GroupDocs वेबसाइट पर और अपनी एपीआई कुंजी प्राप्त करें की आवश्यकता है। एक बार आपके पास क्लाइंट आईडी और क्लाइंट सीक्रेट हो जाने के बाद, जावा-आधारित एप्लिकेशन में कोड स्निपेट जोड़ें:

# पंजीकरण के बाद https://dashboard.groupdocs.cloud से अपना client_id और client_secret प्राप्त करें।

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

REST API का उपयोग करके जावा में XML फ़ाइलों से सभी टेक्स्ट कैसे निकालें

Java के लिए GroupDocs.Parser Cloud SDK का उपयोग करके जावा में XML दस्तावेज़ों से पाठ निकालने के लिए, इन चरणों का पालन करें:

  • अपलोड एक्सएमएल फ़ाइल को क्लाउड पर
  • निकालें जावा का उपयोग कर एक्सएमएल से पाठ

फ़ाइल अपलोड करें

सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके XML दस्तावेज़ को क्लाउड पर अपलोड करें:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// जावा का उपयोग करके क्लाउड स्टोरेज में फ़ाइल अपलोड करें
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

परिणामस्वरूप, अपलोड की गई XML फ़ाइल क्लाउड पर आपके डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।

Java का उपयोग करके XML फ़ाइल पार्स करें

यहां चरण और एक उदाहरण कोड स्निपेट हैं जो दर्शाता है कि Java में GroupDocs.Parser Cloud SDK for Java का उपयोग करके XML दस्तावेज़ से टेक्स्ट कैसे निकाला जाए:

  • सबसे पहले, आवश्यक कक्षाओं को अपनी जावा फ़ाइल में आयात करें।
  • दूसरे, ParseApi वर्ग का एक उदाहरण बनाएँ।
  • तीसरा, FileInfo वर्ग का एक उदाहरण बनाएँ।
  • अगला, इनपुट के रूप में XML फ़ाइल का पथ सेट करें।
  • फिर, TextOptions() वर्ग का एक उदाहरण बनाएँ।
  • इसके बाद, FileInfo को setFileInfo मेथड में असाइन करें।
  • अब, TextRequest() वर्ग का एक उदाहरण बनाएं और TextOptions पैरामीटर पास करें।
  • अंत में, ParseApi.text() विधि को कॉल करके और TextRequest पैरामीटर पास करके परिणाम प्राप्त करें।

निम्न कोड नमूना दिखाता है कि कैसे पाठ को निकालना है और जावा में REST API का उपयोग करके एक XML दस्तावेज़ को पार्स करना है:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// जावा में XML फ़ाइल से टेक्स्ट कैसे निकालें।
public class App {

	public static void main(String[] args) {
		
		// पार्स एपीआई का एक उदाहरण बनाएं
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// सेटिंग्स तैयार करें
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// आउटपुट फ़ाइल पथ प्राप्त करें
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

आप नीचे दी गई छवि में आउटपुट देख सकते हैं:

जावा एक्सएमएल दस्तावेज़ों से टेक्स्ट निकालें

जावा में XML दस्तावेज़ से टेक्स्ट निकालें

मुफ्त ऑनलाइन एक्सएमएल पार्सर

XML से टेक्स्ट को मुफ्त में ऑनलाइन निकालने का सबसे अच्छा तरीका क्या है? एक्सएमएल फाइलों को खंगालने के लिए कृपया एक ऑनलाइन एक्सएमएल पार्सर सॉफ्टवेयर आजमाएं। यह एक्सएमएल पार्सर टूल उपर्युक्त जावा पार्सर लाइब्रेरी का उपयोग करके विकसित किया गया है।

निष्कर्ष

अंत में, डेवलपर्स डेटा निष्कर्षण प्रक्रिया को सरल बना सकते हैं और जावा के लिए GroupDocs.Parser Cloud SDK के साथ XML दस्तावेज़ों के भीतर कुशलतापूर्वक डेटा तक पहुँच सकते हैं। इस लेख से आपने जो सीखा वह निम्नलिखित है:

  • REST API का उपयोग करके जावा में XML दस्तावेज़ों से सभी पाठ कैसे निकालें;
  • जावा का उपयोग करके क्लाउड पर प्रोग्रामेटिक रूप से एक XML फ़ाइल अपलोड करें;
  • और XML दस्तावेजों को पार्स करने के लिए ऑनलाइन XML एक्सट्रैक्शन टूल।

इसके अलावा, आप दस्तावेज़ीकरण का उपयोग करके GroupDocs.Parser Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है। जावा एसडीके का पूरा स्रोत कोड गीथूब पर स्वतंत्र रूप से उपलब्ध है।

अंत में, हम विभिन्न फ़ाइल स्वरूपों पर नए ब्लॉग लेख लिखते रहते हैं और REST API का उपयोग करके पार्स करते हैं। तो, कृपया नवीनतम अपडेट के लिए संपर्क करें।

प्रश्न पूछें

यदि आपके पास XML डेटा पार्सर के बारे में कोई प्रश्न या भ्रम है, तो कृपया बेझिझक हमसे हमारे फोरम के माध्यम से संपर्क करें।

पूछे जाने वाले प्रश्न

मैं जावा का उपयोग करके XML फ़ाइल से सभी पाठ कैसे निकालूं?

आप सबसे पहले ParserApi क्लास को इनिशियलाइज़ करते हैं और GroupDocs.Parser Cloud SDK for Java का इस्तेमाल करके हमारे एपीआई क्रेडेंशियल सेट करते हैं। फिर, एक ExtractOptions ऑब्जेक्ट बनाएं और FileInfo का उपयोग करके XML दस्तावेज़ फ़ाइल निर्दिष्ट करें। अंत में, एक्सट्रैक्ट मेथड को कॉल करें, विकल्पों में पास करें, और गेटटेक्स्ट मेथड का उपयोग करके निकाले गए टेक्स्ट को पुनः प्राप्त करें।

मैं जावा का उपयोग कर एक्सएमएल दस्तावेज़ों का विश्लेषण कैसे करूं?

आप अपने जावा अनुप्रयोगों में GroupDocs.Parser Cloud SDK for Java का उपयोग करके XML फ़ाइल को पार्स कर सकते हैं। यह शक्तिशाली एसडीके जावा में एक्सएमएल फाइलों से डेटा निकालने का एक कुशल और सीधा तरीका प्रदान करता है।

यह सभी देखें

यहां कुछ संबंधित लेख दिए गए हैं जो आपके लिए उपयोगी हो सकते हैं: