PPTX در Node.js

متن را از PowerPoint PPT/PPTX در Node.js استخراج کنید

در سناریوهای خاصی، متن قالب‌بندی‌شده از اسناد برای پردازش بیشتر مانند تجزیه و تحلیل متن، طبقه‌بندی و غیره استخراج می‌شود. در میان فرمت‌های فایل دیگر مانند PDF و Word، PowerPoint Presentation نیز در استخراج متن استفاده می‌شود. بنابراین، این مقاله نحوه استخراج متن از PowerPoint PPT/PPTX در Node.js را نشان می دهد. شما به راحتی می توانید ارائه ها و متن های پاورپوینت PPT/PPTX خود را از یک اسلاید خاص تجزیه کنید یا تمام متن را به صورت برنامه ریزی شده در فضای ابری استخراج کنید.

موضوعات زیر در این مقاله مورد بحث قرار خواهند گرفت:

کتابخانه Node.js برای استخراج متن از PowerPoint PPT

برای تجزیه اسناد پاورپوینت، از Node.js SDK از GroupDocs.Parser Cloud API استفاده خواهم کرد. این به شما امکان می دهد داده ها را از بیش از 50 نوع [فرمت های سند] پشتیبانی شده تجزیه کنید. همچنین از تجزیه کانتینرهایی مانند ZIP بایگانی، OST فایل‌های داده ایمیل، کتاب‌های الکترونیکی، نشانه‌گذاری‌ها، پاورپوینت و پورتفولیوهای PDF در برنامه‌های Node.js شما پشتیبانی می‌کند. با استفاده از SDK می توانید متن، تصاویر و داده ها را توسط یک الگو استخراج کنید. همچنین دات نت، جاوا، پی اچ پی، روبی، و SDKهای پایتون را به عنوان [اعضای خانواده تجزیه کننده سند8 خود برای Cloud API فراهم می کند.

می‌توانید GroupDocs.Parser Cloud را در برنامه Node.js خود با استفاده از دستور زیر در کنسول نصب کنید:

npm install groupdocs-parser-cloud

لطفاً قبل از انجام مراحل ذکر شده [شناسه مشتری و راز خود را از داشبورد 9 دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کد را مطابق شکل زیر اضافه کنید:

# Node.js SDK را در برنامه نود خود از http://api.groupdocs.cloud وارد کنید
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// ClientId و clientSecret را از https://dashboard.groupdocs.cloud دریافت کنید (ثبت نام رایگان لازم است).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

تمام متن را از PowerPoint PPT/PPTX در Node.js با استفاده از REST API استخراج کنید

شما می توانید با دنبال کردن مراحل ساده زیر، متن را از ارائه های پاورپوینت استخراج کنید:

  • آپلود فایل پاورپوینت در Cloud
  • Extract Text از ارائه پاورپوینت با استفاده از Node.js

آپلود فایل

ابتدا سند پاورپوینت را با استفاده از مثال کد زیر در Cloud آپلود کنید:

// فایل را در IOStream از درایو سیستم خود باز کنید.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// خواندن فایل
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi را بسازید
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // ایجاد درخواست آپلود فایل
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // آپلود فایل
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

در نتیجه، فایل پاورپوینت آپلود شده در بخش فایل ها داشبورد شما در فضای ابری در دسترس خواهد بود.

استخراج متن از ارائه پاورپوینت با استفاده از Node.js

با انجام مراحل زیر به راحتی می توانید تمام متن ها را از فایل های پاورپوینت به صورت برنامه نویسی استخراج کنید:

  • ابتدا یک نمونه از ParseApi ایجاد کنید.
  • در مرحله دوم، یک نمونه از FileInfo ایجاد کنید.
  • سپس مسیر فایل پاورپوینت را تنظیم کنید.
  • یک نمونه از TextOptions ایجاد کنید.
  • سپس FileInfo را به TextOptions اختصاص دهید.
  • یک نمونه از FormattedTextOptions ایجاد کنید.
  • حالت formattedTextOptions را به عنوان PlainText تنظیم کنید
  • سپس مقدار formattedTextOptions را تعیین کنید
  • اکنون، یک نمونه از TextRequest با TextOptions ایجاد کنید.
  • در نهایت، با فراخوانی متد ParseApi.text() با TextRequest به نتیجه برسید.

نمونه کد زیر نحوه استخراج تمام متن از فایل پاورپوینت را با استفاده از REST API در Node.js نشان می دهد:

// نحوه استخراج تمام متن از PowerPoint PPT/PPTX در Node.js با استفاده از REST API
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // ایجاد درخواست تجزیه سند
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // نمایش نتایج
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
نحوه استخراج متن از ارائه پاورپوینت با استفاده از Node.js

استخراج متن از ارائه پاورپوینت با استفاده از Node.js

استخراج متن از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js

با دنبال کردن مراحل زیر می توانید متن را از صفحات خاصی از یک فایل PDF به صورت برنامه نویسی استخراج کنید:

  • ابتدا یک نمونه از ParseApi ایجاد کنید.
  • سپس یک نمونه از FileInfo ایجاد کنید.
  • سپس مسیر فایل پاورپوینت PPTX را تنظیم کنید.
  • یک نمونه از TextOptions ایجاد کنید.
  • سپس FileInfo را به TextOptions اختصاص دهید.
  • مقادیر startPageNumber و countPagesToExtract را تنظیم کنید
  • یک نمونه از FormattedTextOptions ایجاد کنید.
  • حالت formattedTextOptions را به عنوان PlainText تنظیم کنید
  • سپس مقدار formattedTextOptions را تعیین کنید.
  • شماره صفحه شروع و تعداد کل صفحات را برای استخراج تنظیم کنید.
  • اکنون، یک نمونه از TextRequest با TextOptions ایجاد کنید.
  • در نهایت، با فراخوانی متد ParseApi.text() با TextRequest به نتیجه برسید.

نمونه کد زیر نحوه استخراج متن خاص از فایل PowerPoint PPTX بر اساس شماره صفحه در Node.js با استفاده از REST API را نشان می دهد:

// نحوه استخراج متن از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // درخواست تجزیه سند ایجاد کنید
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // نمایش نتایج
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
نحوه استخراج متن از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js

متن را از پاورپوینت PPT بر اساس محدوده شماره صفحه در Node.js استخراج کنید

آنلاین را امتحان کنید

لطفاً [ابزار تجزیه آنلاین پاورپوینت رایگان17 زیر را امتحان کنید، که با استفاده از API فوق توسعه یافته است.

نتیجه

در این مقاله نحوه تجزیه و استخراج متن از PowerPoint PPT در Nodejs را یاد گرفتید. تو دیده ای:

  • نحوه استخراج متن از یک اسلاید خاص در Node.js با استفاده از REST API.
  • نحوه استخراج متن از تمام اسلایدهای ارائه پاورپوینت در Node.js.
  • به صورت برنامه نویسی یک فایل پاورپوینت را در فضای ابری آپلود کنید.

علاوه بر این، می‌توانید با استفاده از مستندات درباره GroupDocs.Parser Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می‌کنیم که به شما امکان می‌دهد APIهای ما را مستقیماً از طریق مرورگر تجسم کرده و با آن‌ها تعامل داشته باشید. در صورت وجود هر گونه ابهام، لطفاً با ما در تالار تماس بگیرید.

یه سوال بپرس

در صورتی که در مورد استخراج متن آنلاین سؤال یا ابهامی دارید، از طریق [فروم 21 ما به ما اطلاع دهید.

سوالات متداول

چگونه می توانم متن را از پاورپوینت در Node.js استخراج کنم؟

لطفاً [این پیوند] را دنبال کنید (https://blog.groupdocs.cloud/fa/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) برای یادگیری قطعه کد Node.js برای نحوه استخراج متن از فایل های PPT در Node.js.

چگونه با استفاده از REST API متن را از اسناد PPT به صورت آنلاین استخراج کنیم؟

ابتدا یک نمونه از ParseApi ایجاد کنید، مقادیر TextOptions را تنظیم کنید و اکنون [ParseApi.text()] را فراخوانی کنید(https:// روش apireference.groupdocs.cloud/parser/#/Parse/Text) با TextRequest برای استخراج متن انتخابی از فایل های PPT به صورت آنلاین.

چگونه یک کتابخانه دانلود رایگان استخراج متن PPT را نصب کنیم؟

می‌توانید استخراج‌کننده متن PPT کتابخانه Node.js را برای استخراج متن از فایل‌های PPT به صورت برنامه‌نویسی نصب کنید.

چگونه می توانم متن را از PPT آفلاین در ویندوز استخراج کنم؟

لطفاً برای دانلود نرم افزار استخراج متن برای ویندوز به این پیوند مراجعه کنید. این ابزار استخراج متن، متن را در ویندوز فورا و با یک کلیک استخراج می کند.

همچنین ببینید