कुछ परिदृश्यों में, स्वरूपित पाठ को आगे की प्रक्रिया जैसे पाठ विश्लेषण, वर्गीकरण आदि के लिए दस्तावेज़ों से निकाला जाता है। पीडीएफ और वर्ड जैसे अन्य फ़ाइल स्वरूपों में, पावरपॉइंट प्रस्तुति का उपयोग पाठ निष्कर्षण में भी किया जाता है। इसलिए, यह आलेख दर्शाता है कि कैसे Node.js में PowerPoint PPT/PPTX से पाठ निकालने के लिए। आप अपने PowerPoint PPT/PPTX प्रस्तुतियों और टेक्स्ट को एक विशिष्ट स्लाइड से आसानी से पार्स कर सकते हैं या क्लाउड पर प्रोग्रामेटिक रूप से सभी टेक्स्ट निकाल सकते हैं।
इस लेख में निम्नलिखित विषयों पर चर्चा की जाएगी:
- PowerPoint PPT से टेक्स्ट निकालने के लिए Node.js लाइब्रेरी
- REST API का उपयोग करके Node.js में PowerPoint PPT/PPTX से सभी टेक्स्ट निकालें
- Node.js में पेज नंबर रेंज द्वारा PowerPoint PPT से टेक्स्ट निकालें
PowerPoint PPT से टेक्स्ट निकालने के लिए Node.js लाइब्रेरी
PowerPoint दस्तावेज़ों को पार्स करने के लिए, मैं GroupDocs.Parser Cloud API के Node.js SDK का उपयोग करूंगा। यह आपको 50 से अधिक प्रकार के समर्थित दस्तावेज़ प्रारूप से डेटा पार्स करने की अनुमति देता है। यह आपके नोड.जेएस अनुप्रयोगों में ज़िप अभिलेखागार, ओएसटी मेल डेटा फ़ाइलों, ई-पुस्तकों, मार्कअप, पॉवरपॉइंट और पीडीएफ पोर्टफोलियो जैसे कंटेनरों की पार्सिंग का भी समर्थन करता है। आप SDK का उपयोग करके टेम्पलेट द्वारा पाठ, चित्र और डेटा पार्स कर सकते हैं। यह क्लाउड एपीआई के लिए अपने दस्तावेज़ पार्सर परिवार के सदस्यों के रूप में .NET, Java, PHP, Ruby और Python SDKs भी प्रदान करता है।
आप कंसोल में निम्न आदेश का उपयोग करके GroupDocs.Parser क्लाउड को अपने Node.js एप्लिकेशन में इंस्टॉल कर सकते हैं:
npm install groupdocs-parser-cloud
कृपया उल्लिखित चरणों का पालन करने से पहले डैशबोर्ड से अपनी क्लाइंट आईडी और सीक्रेट प्राप्त करें। एक बार आपके पास अपनी आईडी और रहस्य होने के बाद, नीचे दिखाए गए कोड में जोड़ें:
# http://api.groupdocs.cloud से अपने नोड एप्लिकेशन में Node.js SDK आयात करें
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");
// https://dashboard.groupdocs.cloud से clientId और clientSecret प्राप्त करें (मुफ्त पंजीकरण आवश्यक है)।
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";
REST API का उपयोग करके Node.js में PowerPoint PPT/PPTX से सभी टेक्स्ट निकालें
आप नीचे बताए गए सरल चरणों का पालन करके PowerPoint प्रस्तुतियों से पाठ निकाल सकते हैं:
- अपलोड क्लाउड पर PowerPoint फ़ाइल
- टेक्स्ट निकालें नोड.जेएस का उपयोग करके पावरपॉइंट प्रेजेंटेशन से
फ़ाइल अपलोड करें
सबसे पहले, नीचे दिए गए कोड उदाहरण का उपयोग करके PowerPoint दस्तावेज़ को क्लाउड पर अपलोड करें:
// अपने सिस्टम ड्राइव से IOStream में फ़ाइल खोलें।
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// फ़ाइल पढ़ें
fs.readFile(resourcesFolder, (err, fileStream) => {
// FileApi का निर्माण करें
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
// अपलोड फ़ाइल अनुरोध बनाएँ
var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
// फ़ाइल अपलोड करें
fileApi.uploadFile(request)
.then(function (response) {
console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
});
परिणामस्वरूप, अपलोड की गई PowerPoint फ़ाइल क्लाउड पर आपके डैशबोर्ड के फ़ाइल अनुभाग में उपलब्ध होगी।
Node.js का उपयोग करके PowerPoint प्रस्तुति से टेक्स्ट निकालें
आप नीचे दिए गए चरणों का पालन करके आसानी से PowerPoint फ़ाइलों से सभी टेक्स्ट को प्रोग्रामेटिक रूप से निकाल सकते हैं:
- सबसे पहले, ParseApi का एक उदाहरण बनाएँ।
- दूसरे, FileInfo का एक उदाहरण बनाएँ।
- फिर, PowerPoint फ़ाइल के लिए पथ सेट करें।
- टेक्स्टऑप्शन का एक उदाहरण बनाएं।
- फिर, FileInfo को TextOptions को असाइन करें।
- स्वरूपित टेक्स्टऑप्शन का एक उदाहरण बनाएं।
- स्वरूपित टेक्स्ट विकल्प मोड को प्लेन टेक्स्ट के रूप में सेट करें
- अगला, स्वरूपित टेक्स्टऑप्शन मान असाइन करें
- अब, TextOptions के साथ TextRequest का एक उदाहरण बनाएँ।
- अंत में, ParseApi.text() विधि को TextRequest के साथ कॉल करके परिणाम प्राप्त करें।
निम्न कोड नमूना दिखाता है कि कैसे Node.js में REST API का उपयोग करके PowerPoint फ़ाइल से सभी पाठ को निकालना है:
// REST API का उपयोग करके Node.js में PowerPoint PPT/PPTX से सभी टेक्स्ट कैसे निकालें
const parse = async () => {
global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "nodejs-testing/sample-file.pptx";
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "PlainText";
options.formattedTextOptions = formattedTextOptions;
try {
// पार्स दस्तावेज़ अनुरोध बनाएँ
let request = new groupdocs_parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
// परिणाम प्रदर्शित करें
console.log(response.text);
}
catch (err) {
throw err;
}
}
parse()
.then(() => {
console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Node.js{#Extract-Text-from-PowerPoint-PPT-by-Page-Number-Range-in-Node.js} में पृष्ठ संख्या श्रेणी द्वारा PowerPoint PPT से पाठ निकालें
आप नीचे दिए गए चरणों का पालन करके प्रोग्रामेटिक रूप से पीडीएफ फाइल के विशिष्ट पृष्ठों से टेक्स्ट निकाल सकते हैं:
- सबसे पहले, ParseApi का एक उदाहरण बनाएँ।
- अगला, FileInfo का एक उदाहरण बनाएँ।
- फिर, PowerPoint PPTX फ़ाइल के लिए पथ सेट करें।
- टेक्स्टऑप्शन का एक उदाहरण बनाएं।
- फिर, FileInfo को TextOptions को असाइन करें।
- startPageNumber और countPagesToExtract मान सेट करें
- स्वरूपित टेक्स्टऑप्शन का एक उदाहरण बनाएं।
- स्वरूपित टेक्स्ट विकल्प मोड को प्लेन टेक्स्ट के रूप में सेट करें
- अगला, स्वरूपित टेक्स्टऑप्शन मान असाइन करें.
- निकालने के लिए प्रारंभ पृष्ठ संख्या और पृष्ठों की कुल संख्या निर्धारित करें।
- अब, TextOptions के साथ TextRequest का एक उदाहरण बनाएँ।
- अंत में, ParseApi.text() विधि को TextRequest के साथ कॉल करके परिणाम प्राप्त करें।
निम्न कोड नमूना दिखाता है कि REST API का उपयोग करके Node.js में पृष्ठ संख्याओं द्वारा PowerPoint PPTX फ़ाइल से विशिष्ट पाठ कैसे निकाला जाए:
// कैसे Node.js में पृष्ठ संख्या श्रेणी द्वारा PowerPoint पीपीटी से पाठ निकालने के लिए
const parse = async () => {
global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "nodejs-testing/sample-file.pptx";
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 2;
let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "PlainText";
options.formattedTextOptions = formattedTextOptions;
try {
// पार्स दस्तावेज़ अनुरोध बनाएँ
let request = new groupdocs_parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
// परिणाम प्रदर्शित करें
let pages = response.pages;
pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
}
catch (err) {
throw err;
}
}
parse()
.then(() => {
console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
console.log("Error occurred while extracting text from PowerPoint file:", err);
})
ऑनलाइन प्रयास करें
कृपया निम्नलिखित मुफ्त ऑनलाइन पॉवरपॉइंट पार्सिंग टूल का प्रयास करें, जिसे उपरोक्त एपीआई का उपयोग करके विकसित किया गया है।
निष्कर्ष
इस लेख में, आपने सीखा है कि कैसे Nodejs में PowerPoint PPT से टेक्स्ट को पार्स और एक्सट्रेक्ट किया जाता है। तुम्हें देखा गया है:
- REST API का उपयोग करके Node.js में किसी विशिष्ट स्लाइड से टेक्स्ट कैसे निकालें;
- कैसे Node.js में एक PowerPoint प्रस्तुति की सभी स्लाइडों से पाठ निकालने के लिए;
- प्रोग्रामेटिक रूप से एक PowerPoint फ़ाइल को क्लाउड पर अपलोड करें;
इसके अलावा, आप दस्तावेज़ का उपयोग करके GroupDocs.Parser Cloud API के बारे में अधिक जान सकते हैं। हम एक एपीआई संदर्भ अनुभाग भी प्रदान करते हैं जो आपको सीधे ब्राउज़र के माध्यम से हमारे एपीआई के साथ कल्पना और बातचीत करने देता है। किसी भी अस्पष्टता के मामले में, कृपया बेझिझक हमसे फोरम पर संपर्क करें।
प्रश्न पूछें
यदि आपके पास ऑनलाइन टेक्स्ट एक्सट्रैक्टर के बारे में कोई प्रश्न या भ्रम है, तो हमें हमारे फोरम के माध्यम से सूचित करें।
पूछे जाने वाले प्रश्न
मैं Node.js में PowerPoint से पाठ कैसे निकालूँ?
कृपया [इस लिंक](https://blog.groupdocs.cloud/hi/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) Node.js में PPT फ़ाइलों से टेक्स्ट निकालने के तरीके के लिए Node.js कोड स्निपेट सीखने के लिए।
REST API का उपयोग करके PPT दस्तावेज़ों से ऑनलाइन टेक्स्ट कैसे निकालें?
सबसे पहले, ParseApi का एक उदाहरण बनाएं, TextOptions के मान सेट करें, और अब [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) पीपीटी फाइलों से चयनित पाठ को ऑनलाइन निकालने के लिए TextRequest के साथ विधि।
पीपीटी टेक्स्ट एक्सट्रैक्टर मुफ्त डाउनलोड लाइब्रेरी कैसे स्थापित करें?
आप पीपीटी टेक्स्ट एक्सट्रैक्टर Node.js लाइब्रेरी प्रोग्राम के जरिए पीपीटी फाइलों से टेक्स्ट निकालने के लिए इंस्टॉल कर सकते हैं।
मैं विंडोज़ में पीपीटी ऑफलाइन से टेक्स्ट कैसे निकाल सकता हूँ?
विंडोज के लिए टेक्स्ट एक्सट्रैक्टर सॉफ्टवेयर डाउनलोड करने के लिए कृपया इस लिंक पर जाएं। यह टेक्स्ट एक्सट्रैक्टर टूल एक क्लिक के साथ विंडोज़ में टेक्स्ट को तुरंत निकाल देगा।
यह सभी देखें
- Node.js का उपयोग करके PDF फ़ाइलों से छवियाँ निकालें
- Node.js में REST API का उपयोग करके PDF से डेटा निकालें
- पायथन में REST API का उपयोग करके पार्स वर्ड दस्तावेज़
- Node.js में REST API का उपयोग करके PDF से टेक्स्ट निकालें
- Node.js में REST API का उपयोग करके Word दस्तावेज़ पार्स करें
- पायथन का उपयोग करके पीडीएफ से विशिष्ट डेटा निकालें
- पायथन का उपयोग करके पीडीएफ दस्तावेज़ों से छवियां निकालें
- पायथन का उपयोग करके पीडीएफ से टेक्स्ट कैसे निकालें
- पायथन का उपयोग करके पीडीएफ, स्प्रेडशीट, प्रस्तुतियों और वर्ड दस्तावेज़ों से छवियां निकालें