در سناریوهای خاصی، متن قالببندیشده از اسناد برای پردازش بیشتر مانند تجزیه و تحلیل متن، طبقهبندی و غیره استخراج میشود. در میان فرمتهای فایل دیگر مانند PDF و Word، PowerPoint Presentation نیز در استخراج متن استفاده میشود. بنابراین، این مقاله نحوه استخراج متن از PowerPoint PPT/PPTX در Node.js را نشان می دهد. شما به راحتی می توانید ارائه ها و متن های پاورپوینت PPT/PPTX خود را از یک اسلاید خاص تجزیه کنید یا تمام متن را به صورت برنامه ریزی شده در فضای ابری استخراج کنید.
موضوعات زیر در این مقاله مورد بحث قرار خواهند گرفت:
- کتابخانه Node.js برای استخراج متن از پاورپوینت PPT
- تمام متن را از PowerPoint PPT/PPTX در Node.js با استفاده از REST API استخراج کنید
- استخراج متن از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js
کتابخانه Node.js برای استخراج متن از PowerPoint PPT
برای تجزیه اسناد پاورپوینت، از Node.js SDK از GroupDocs.Parser Cloud API استفاده خواهم کرد. این به شما امکان می دهد داده ها را از بیش از 50 نوع [فرمت های سند] پشتیبانی شده تجزیه کنید. همچنین از تجزیه کانتینرهایی مانند ZIP بایگانی، OST فایلهای داده ایمیل، کتابهای الکترونیکی، نشانهگذاریها، پاورپوینت و پورتفولیوهای PDF در برنامههای Node.js شما پشتیبانی میکند. با استفاده از SDK می توانید متن، تصاویر و داده ها را توسط یک الگو استخراج کنید. همچنین دات نت، جاوا، پی اچ پی، روبی، و SDKهای پایتون را به عنوان [اعضای خانواده تجزیه کننده سند8 خود برای Cloud API فراهم می کند.
میتوانید GroupDocs.Parser Cloud را در برنامه Node.js خود با استفاده از دستور زیر در کنسول نصب کنید:
npm install groupdocs-parser-cloud
لطفاً قبل از انجام مراحل ذکر شده [شناسه مشتری و راز خود را از داشبورد 9 دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کد را مطابق شکل زیر اضافه کنید:
# Node.js SDK را در برنامه نود خود از http://api.groupdocs.cloud وارد کنید
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");
// ClientId و clientSecret را از https://dashboard.groupdocs.cloud دریافت کنید (ثبت نام رایگان لازم است).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";
تمام متن را از PowerPoint PPT/PPTX در Node.js با استفاده از REST API استخراج کنید
شما می توانید با دنبال کردن مراحل ساده زیر، متن را از ارائه های پاورپوینت استخراج کنید:
- آپلود فایل پاورپوینت در Cloud
- Extract Text از ارائه پاورپوینت با استفاده از Node.js
آپلود فایل
ابتدا سند پاورپوینت را با استفاده از مثال کد زیر در Cloud آپلود کنید:
// فایل را در IOStream از درایو سیستم خود باز کنید.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// خواندن فایل
fs.readFile(resourcesFolder, (err, fileStream) => {
// FileApi را بسازید
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
// ایجاد درخواست آپلود فایل
var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
// آپلود فایل
fileApi.uploadFile(request)
.then(function (response) {
console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
});
در نتیجه، فایل پاورپوینت آپلود شده در بخش فایل ها داشبورد شما در فضای ابری در دسترس خواهد بود.
استخراج متن از ارائه پاورپوینت با استفاده از Node.js
با انجام مراحل زیر به راحتی می توانید تمام متن ها را از فایل های پاورپوینت به صورت برنامه نویسی استخراج کنید:
- ابتدا یک نمونه از ParseApi ایجاد کنید.
- در مرحله دوم، یک نمونه از FileInfo ایجاد کنید.
- سپس مسیر فایل پاورپوینت را تنظیم کنید.
- یک نمونه از TextOptions ایجاد کنید.
- سپس FileInfo را به TextOptions اختصاص دهید.
- یک نمونه از FormattedTextOptions ایجاد کنید.
- حالت formattedTextOptions را به عنوان PlainText تنظیم کنید
- سپس مقدار formattedTextOptions را تعیین کنید
- اکنون، یک نمونه از TextRequest با TextOptions ایجاد کنید.
- در نهایت، با فراخوانی متد ParseApi.text() با TextRequest به نتیجه برسید.
نمونه کد زیر نحوه استخراج تمام متن از فایل پاورپوینت را با استفاده از REST API در Node.js نشان می دهد:
// نحوه استخراج تمام متن از PowerPoint PPT/PPTX در Node.js با استفاده از REST API
const parse = async () => {
global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "nodejs-testing/sample-file.pptx";
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "PlainText";
options.formattedTextOptions = formattedTextOptions;
try {
// ایجاد درخواست تجزیه سند
let request = new groupdocs_parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
// نمایش نتایج
console.log(response.text);
}
catch (err) {
throw err;
}
}
parse()
.then(() => {
console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
استخراج متن از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js
با دنبال کردن مراحل زیر می توانید متن را از صفحات خاصی از یک فایل PDF به صورت برنامه نویسی استخراج کنید:
- ابتدا یک نمونه از ParseApi ایجاد کنید.
- سپس یک نمونه از FileInfo ایجاد کنید.
- سپس مسیر فایل پاورپوینت PPTX را تنظیم کنید.
- یک نمونه از TextOptions ایجاد کنید.
- سپس FileInfo را به TextOptions اختصاص دهید.
- مقادیر startPageNumber و countPagesToExtract را تنظیم کنید
- یک نمونه از FormattedTextOptions ایجاد کنید.
- حالت formattedTextOptions را به عنوان PlainText تنظیم کنید
- سپس مقدار formattedTextOptions را تعیین کنید.
- شماره صفحه شروع و تعداد کل صفحات را برای استخراج تنظیم کنید.
- اکنون، یک نمونه از TextRequest با TextOptions ایجاد کنید.
- در نهایت، با فراخوانی متد ParseApi.text() با TextRequest به نتیجه برسید.
نمونه کد زیر نحوه استخراج متن خاص از فایل PowerPoint PPTX بر اساس شماره صفحه در Node.js با استفاده از REST API را نشان می دهد:
// نحوه استخراج متن از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js
const parse = async () => {
global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "nodejs-testing/sample-file.pptx";
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 2;
let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "PlainText";
options.formattedTextOptions = formattedTextOptions;
try {
// درخواست تجزیه سند ایجاد کنید
let request = new groupdocs_parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
// نمایش نتایج
let pages = response.pages;
pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
}
catch (err) {
throw err;
}
}
parse()
.then(() => {
console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
console.log("Error occurred while extracting text from PowerPoint file:", err);
})
آنلاین را امتحان کنید
لطفاً [ابزار تجزیه آنلاین پاورپوینت رایگان17 زیر را امتحان کنید، که با استفاده از API فوق توسعه یافته است.
نتیجه
در این مقاله نحوه تجزیه و استخراج متن از PowerPoint PPT در Nodejs را یاد گرفتید. تو دیده ای:
- نحوه استخراج متن از یک اسلاید خاص در Node.js با استفاده از REST API.
- نحوه استخراج متن از تمام اسلایدهای ارائه پاورپوینت در Node.js.
- به صورت برنامه نویسی یک فایل پاورپوینت را در فضای ابری آپلود کنید.
علاوه بر این، میتوانید با استفاده از مستندات درباره GroupDocs.Parser Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه میکنیم که به شما امکان میدهد APIهای ما را مستقیماً از طریق مرورگر تجسم کرده و با آنها تعامل داشته باشید. در صورت وجود هر گونه ابهام، لطفاً با ما در تالار تماس بگیرید.
یه سوال بپرس
در صورتی که در مورد استخراج متن آنلاین سؤال یا ابهامی دارید، از طریق [فروم 21 ما به ما اطلاع دهید.
سوالات متداول
چگونه می توانم متن را از پاورپوینت در Node.js استخراج کنم؟
لطفاً [این پیوند] را دنبال کنید (https://blog.groupdocs.cloud/fa/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) برای یادگیری قطعه کد Node.js برای نحوه استخراج متن از فایل های PPT در Node.js.
چگونه با استفاده از REST API متن را از اسناد PPT به صورت آنلاین استخراج کنیم؟
ابتدا یک نمونه از ParseApi ایجاد کنید، مقادیر TextOptions را تنظیم کنید و اکنون [ParseApi.text()] را فراخوانی کنید(https:// روش apireference.groupdocs.cloud/parser/#/Parse/Text) با TextRequest برای استخراج متن انتخابی از فایل های PPT به صورت آنلاین.
چگونه یک کتابخانه دانلود رایگان استخراج متن PPT را نصب کنیم؟
میتوانید استخراجکننده متن PPT کتابخانه Node.js را برای استخراج متن از فایلهای PPT به صورت برنامهنویسی نصب کنید.
چگونه می توانم متن را از PPT آفلاین در ویندوز استخراج کنم؟
لطفاً برای دانلود نرم افزار استخراج متن برای ویندوز به این پیوند مراجعه کنید. این ابزار استخراج متن، متن را در ویندوز فورا و با یک کلیک استخراج می کند.
همچنین ببینید
- استخراج تصاویر از فایل های PDF با استفاده از Node.js
- استخراج داده ها از PDF با استفاده از REST API در Node.js
- تجزیه و تحلیل اسناد Word با استفاده از REST API در پایتون
- استخراج متن از PDF با استفاده از REST API در Node.js
- اسناد Word را با استفاده از REST API در Node.js تجزیه کنید
- استخراج داده های خاص از PDF با استفاده از پایتون
- استخراج تصاویر از اسناد PDF با استفاده از پایتون
- نحوه استخراج متن از PDF با استفاده از پایتون
- استخراج تصاویر از PDF، صفحات گسترده، ارائه ها و اسناد Word با استفاده از پایتون