आपको विभिन्न उद्देश्यों के लिए अपने Word दस्तावेज़ों से पाठ या चित्र निकालने की आवश्यकता हो सकती है। आप Word दस्तावेज़ों को आसानी से पार्स कर सकते हैं और अपने Node.js अनुप्रयोगों में प्रोग्रामेटिक रूप से पाठ पढ़ सकते हैं। Node.js डेवलपर के रूप में, आप क्लाउड पर DOCX फ़ाइलों से प्रोग्रामेटिक रूप से सभी टेक्स्ट और छवियां निकाल सकते हैं। यह लेख इस बात पर ध्यान केंद्रित करेगा कि Node.js में REST API का उपयोग करके Word दस्तावेज़ों को कैसे पार्स किया जाए।
इस लेख में निम्नलिखित विषयों को शामिल किया जाएगा:
- दस्तावेज़ पार्सर REST API और Node.js SDK
- Word दस्तावेज़ों को पार्स करें और Node.js में REST API का उपयोग करके छवियाँ निकालें
- REST API का उपयोग करके Word दस्तावेज़ों से टेक्स्ट निकालें
दस्तावेज़ पार्सर REST API और Node.js SDK
DOCX दस्तावेज़ों को पार्स करने के लिए, मैं GroupDocs.Parser Cloud के Node.js SDK API का उपयोग करूंगा। यह आपको 50 से अधिक दस्तावेज़ प्रकारों से डेटा पार्स करने की अनुमति देता है। यह आपके Node.js अनुप्रयोगों में ZIP अभिलेखागार, OST/PST मेल डेटा फ़ाइलों, ई-पुस्तकों, मार्कअप और PDF पोर्टफोलियो जैसे कंटेनरों की पार्सिंग का भी समर्थन करता है। आप एसडीके का उपयोग कर टेम्पलेट द्वारा टेक्स्ट, इमेज और डेटा पार्स कर सकते हैं। यह क्लाउड एपीआई के लिए अपने दस्तावेज़ पार्सर परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby और Python SDKs भी प्रदान करता है।
आप कंसोल में निम्न आदेश का उपयोग करके GroupDocs.Parser क्लाउड को अपने Node.js एप्लिकेशन में इंस्टॉल कर सकते हैं:
npm install groupdocs-parser-cloud
कृपया उल्लिखित चरणों का पालन करने से पहले डैशबोर्ड से अपनी क्लाइंट आईडी और सीक्रेट प्राप्त करें। एक बार आपके पास अपनी आईडी और रहस्य होने के बाद, नीचे दिखाए गए कोड में जोड़ें:
global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";
Word दस्तावेज़ों को पार्स करें और Node.js में REST API का उपयोग करके छवियाँ निकालें
आप नीचे बताए गए चरणों का पालन करके अपने Word दस्तावेज़ों को पार्स कर सकते हैं और प्रोग्रामेटिक रूप से चित्र निकाल सकते हैं:
- अपलोड वर्ड फाइल को क्लाउड पर
- Node.js का उपयोग करके Word दस्तावेज़ों से चित्र निकालें
- डाउनलोड निकाले गए चित्र
दस्तावेज़ अपलोड करें
सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके Word दस्तावेज़ (DOCX) को क्लाउड पर अपलोड करें:
// एपीआई को इनिशियलाइज़ करें
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
let resourcesFolder = 'C:\\Files\\sample.docx';
// फ़ाइल पढ़ें
fs.readFile(resourcesFolder, (err, fileStream) => {
// फ़ाइल अपलोड अनुरोध बनाएँ
let request = new groupdocs_parser_cloud.UploadFileRequest("sample.docx", fileStream, myStorage);
// फ़ाइल अपलोड करें
fileApi.uploadFile(request);
});
परिणामस्वरूप, अपलोड की गई DOCX फ़ाइल क्लाउड पर आपके डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।
Node.js का उपयोग करके Word दस्तावेज़ों से छवियाँ निकालें
आप नीचे बताए गए चरणों का पालन करके आसानी से Word दस्तावेज़ों से सभी छवियों को निकाल सकते हैं।
- ParseApi का एक उदाहरण बनाएँ
- FileInfo का एक उदाहरण बनाएँ
- DOCX फ़ाइल के लिए पथ सेट करें
- ImageOptions का एक उदाहरण बनाएँ
- ImageOptions को FileInfo असाइन करें
- इमेज रिक्वेस्ट बनाएं
- ParseApi.images() विधि को कॉल करके परिणाम प्राप्त करें
निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके DOCX फ़ाइल से छवियों को कैसे निकाला जाए।
// एपीआई आरंभीकरण
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// नमूना फ़ाइल जानकारी
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// छवि विकल्पों को परिभाषित करें
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// छवि अनुरोध बनाएँ
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// चित्र प्राप्त करें
let result = await parseApi.images(request);
// चित्र डाउनलोड पथ दिखाएं
let images = result.images;
images.forEach(image => {
console.log("Image path in storage: " + image.path);
console.log("Download url: " + image.downloadUrl);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
निकाली गई छवियां डाउनलोड करें
उपरोक्त कोड नमूना क्लाउड पर निकाली गई छवियों को सहेजेगा। आप नीचे दिए गए कोड नमूने का उपयोग करके इन छवियों को डाउनलोड कर सकते हैं:
// एपीआई को इनिशियलाइज़ करें
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
// फ़ाइल डाउनलोड अनुरोध बनाएँ
let request = new groupdocs_parser_cloud.DownloadFileRequest("parser/images/sample_docx/image_0.png", myStorage);
// डाउनलोड फ़ाइल
let response = await fileApi.downloadFile(request);
// वर्किंग डायरेक्टरी में इमेज फाइल सेव करें
fs.writeFile("C:\\Files\\images\\image_0.png", response, "binary", function (err) { });
console.log(response);
Node.js का उपयोग करके Word दस्तावेज़ों से टेक्स्ट निकालें
आप नीचे बताए गए चरणों का पालन करके आसानी से Word दस्तावेज़ों से सभी पाठ निकाल सकते हैं।
- ParseApi का एक उदाहरण बनाएँ
- FileInfo का एक उदाहरण बनाएँ
- DOCX फ़ाइल के लिए पथ सेट करें
- टेक्स्टऑप्शन का एक उदाहरण बनाएं
- FileInfo को TextOptions को असाइन करें
- प्रारंभ पृष्ठ संख्या सेट करें
- स्वरूपित पाठ विकल्प परिभाषित करें
- टेक्स्ट रिक्वेस्ट बनाएं
- ParseApi.text() पद्धति को कॉल करके परिणाम प्राप्त करें
निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके DOCX फ़ाइल से टेक्स्ट कैसे निकाला जाए।
// एपीआई आरंभीकरण
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// नमूना फ़ाइल जानकारी
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// पाठ विकल्पों को परिभाषित करें
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 1;
options.formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions({
mode: "Html" // extract text in HTML
});
// पाठ अनुरोध बनाएँ
let request = new groupdocs_parser_cloud.TextRequest(options);
// पाठ प्राप्त करें
let result = await parseApi.text(request);
// निकाला हुआ पाठ दिखाएं
let pages = result.pages;
pages.forEach(page => console.log(page.text));
ऑनलाइन प्रयास करें
कृपया निम्नलिखित नि:शुल्क ऑनलाइन DOCX पार्सिंग टूल का प्रयास करें, जिसे उपरोक्त API का उपयोग करके विकसित किया गया है। https://products.groupdocs.app/parser/docx
निष्कर्ष
इस लेख में, आपने क्लाउड पर Word दस्तावेज़ों को पार्स करना सीखा है। आपने यह भी सीखा है कि Node.js में REST API का उपयोग करके DOCX फ़ाइलों से चित्र और पाठ कैसे निकाले जाते हैं। इस लेख में यह भी बताया गया है कि क्लाउड पर DOCX फ़ाइल को प्रोग्रामेटिक रूप से कैसे अपलोड किया जाए और क्लाउड से छवि फ़ाइलों को कैसे डाउनलोड किया जाए। दस्तावेज़ का उपयोग करके आप GroupDocs.Parser Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई को देखने और बातचीत करने देता है। किसी भी अस्पष्टता के मामले में, कृपया बेझिझक हमसे फोरम पर संपर्क करें।