PPTX في Node.js

استخراج النص من PowerPoint PPT / PPTX في Node.js

في سيناريوهات معينة ، يتم استخراج النص المنسق من المستندات لمزيد من المعالجة مثل تحليل النص والتصنيف وما إلى ذلك. من بين تنسيقات الملفات الأخرى مثل PDF و Word ، يُستخدم العرض التقديمي PowerPoint أيضًا في استخراج النص. لذلك ، توضح هذه المقالة كيفية استخراج النص من PowerPoint PPT / PPTX في Node.js. يمكنك بسهولة تحليل عروض PowerPoint PPT / PPTX التقديمية والنص من شريحة معينة أو استخراج كل النص برمجيًا على السحابة.

سيتم مناقشة الموضوعات التالية في هذه المقالة:

مكتبة Node.js لاستخراج النص من PowerPoint PPT

لتحليل مستندات PowerPoint ، سأستخدم Node.js SDK من GroupDocs.Parser Cloud API. يسمح لك بتحليل البيانات من أكثر من 50 نوعًا من [تنسيقات المستندات] المدعومة 4. كما أنه يدعم تحليل الحاويات مثل أرشيفات ZIP ، OST ملفات بيانات البريد ، الكتب الإلكترونية ، العلامات ، حافظات PowerPoint و PDF في تطبيقات Node.js الخاصة بك. يمكنك استخراج النص والصور وتحليل البيانات بواسطة قالب باستخدام SDK. كما أنها توفر أدوات تطوير البرامج (SDKs).NET و Java و PHP و Ruby و Python باعتبارها أعضاء عائلة محلل المستندات لواجهة برمجة التطبيقات السحابية.

يمكنك تثبيت GroupDocs.Parser Cloud على تطبيق Node.js الخاص بك باستخدام الأمر التالي في وحدة التحكم:

npm install groupdocs-parser-cloud

يرجى الحصول على معرف العميل والسرية من لوحة التحكم قبل اتباع الخطوات المذكورة. بمجرد حصولك على المعرف والسر الخاص بك ، قم بإضافة الرمز كما هو موضح أدناه:

# قم باستيراد Node.js SDK في تطبيق العقدة من http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// احصل على clientId و clientSecret من https://dashboard.groupdocs.cloud (التسجيل المجاني مطلوب).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

استخراج كل النص من PowerPoint PPT / PPTX في Node.js باستخدام REST API

يمكنك استخراج نص من عروض PowerPoint التقديمية باتباع الخطوات البسيطة المذكورة أدناه:

تحميل الملف

أولاً ، قم بتحميل مستند PowerPoint على السحابة باستخدام مثال الرمز الموضح أدناه:

// افتح الملف في IOStream من محرك أقراص النظام.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// إقرا الملف
fs.readFile(resourcesFolder, (err, fileStream) => {
  // بناء FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // طلب إنشاء ملف تحميل
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // رفع ملف
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

نتيجة لذلك ، سيكون ملف PowerPoint الذي تم تحميله متاحًا في قسم الملفات من لوحة التحكم على السحابة.

استخراج نص من PowerPoint Presentation باستخدام Node.js

يمكنك بسهولة استخراج كل النص من ملفات PowerPoint برمجيًا باتباع الخطوات الواردة أدناه:

  • أولاً ، قم بإنشاء مثيل لـ ParseApi.
  • ثانيًا ، قم بإنشاء مثيل لـ FileInfo.
  • ثم قم بتعيين المسار إلى ملف PowerPoint.
  • قم بإنشاء مثيل لـ TextOptions.
  • ثم قم بتعيين FileInfo إلى TextOptions.
  • قم بإنشاء مثيل لـ FormattedTextOptions.
  • قم بتعيين وضع formattedTextOptions على أنه PlainText
  • بعد ذلك ، قم بتعيين قيمة formattedTextOptions
  • الآن ، قم بإنشاء مثيل لـ TextRequest باستخدام TextOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء الأسلوب ParseApi.text() باستخدام TextRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج كل النص من ملف PowerPoint باستخدام واجهة برمجة تطبيقات REST في Node.js:

// كيفية استخراج كل النص من PowerPoint PPT / PPTX في Node.js باستخدام REST API
const parse = async() => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // إنشاء طلب مستند التحليل
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // عرض النتائج
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
كيفية استخراج نص من PowerPoint Presentation باستخدام Node.js

استخراج نص من PowerPoint Presentation باستخدام Node.js

استخراج النص من PowerPoint PPT حسب نطاق رقم الصفحة في Node.js

يمكنك استخراج النص من صفحات معينة من ملف PDF برمجيًا باتباع الخطوات الواردة أدناه:

  • أولاً ، قم بإنشاء مثيل لـ ParseApi.
  • بعد ذلك ، قم بإنشاء مثيل FileInfo.
  • ثم قم بتعيين المسار إلى ملف PowerPoint PPTX.
  • قم بإنشاء مثيل لـ TextOptions.
  • ثم قم بتعيين FileInfo إلى TextOptions.
  • قم بتعيين قيم startPageNumber و countPagesToExtract
  • قم بإنشاء مثيل لـ FormattedTextOptions.
  • قم بتعيين وضع formattedTextOptions على أنه PlainText
  • بعد ذلك ، قم بتعيين قيمة formattedTextOptions.
  • قم بتعيين رقم صفحة البداية والعدد الإجمالي للصفحات المراد استخراجها.
  • الآن ، قم بإنشاء مثيل لـ TextRequest باستخدام TextOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء الأسلوب ParseApi.text() باستخدام TextRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج نص معين من ملف PowerPoint PPTX حسب أرقام الصفحات في Node.js باستخدام REST API:

// كيفية استخراج النص من PowerPoint PPT حسب نطاق رقم الصفحة في Node.js
const parse = async() => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // إنشاء طلب مستند التحليل
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // عرض النتائج
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
كيفية استخراج النص من PowerPoint PPT حسب نطاق رقم الصفحة في Node.js

استخراج النص من PowerPoint PPT حسب نطاق رقم الصفحة في Node.js

جرب عبر الإنترنت

يرجى تجربة [أداة تحليل PowerPoint المجانية عبر الإنترنت] التالية 17 ، والتي تم تطويرها باستخدام واجهة برمجة التطبيقات المذكورة أعلاه.

خاتمة

في هذه المقالة ، تعلمت كيفية تحليل واستخراج النص من PowerPoint PPT في Nodejs. لقد رأيت:

  • كيفية استخراج نص من شرائح معينة في Node.js باستخدام REST API ؛
  • كيفية استخراج النص من جميع شرائح عرض PowerPoint التقديمي في Node.js ؛
  • تحميل ملف PowerPoint برمجيًا إلى السحابة ؛

بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. في حالة وجود أي غموض ، فلا تتردد في الاتصال بنا على المنتدى.

طرح سؤال

في حال كان لديك أي استفسارات أو ارتباك حول أداة استخراج النص عبر الإنترنت ، فأخبرنا بذلك عبر المنتدى.

أسئلة وأجوبة

كيف يمكنني استخراج نص من PowerPoint في Node.js؟

يرجى اتباع [هذا الرابط](https://blog.groupdocs.cloud/ar/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) لمعرفة مقتطف رمز Node.js لكيفية استخراج النص من ملفات PPT في Node.js.

كيفية استخراج نص من مستندات PPT عبر الإنترنت باستخدام REST API؟

أولاً ، أنشئ مثيلاً لـ ParseApi ، واضبط قيم TextOptions ، واستدع الآن [ParseApi.text()](https: // apireference.groupdocs.cloud/parser/#/Parse/Text) مع TextRequest لاستخراج النص المحدد من ملفات PPT عبر الإنترنت.

كيفية تثبيت مكتبة تنزيل مستخرج نصوص PPT مجانًا؟

يمكنك تثبيت مستخرج نص PPT مكتبة Node.js لاستخراج النص من ملفات PPT برمجيًا.

كيف يمكنني استخراج نص من PPT دون اتصال في Windows؟

يرجى زيارة هذا الرابط لتنزيل برنامج استخراج النصوص لنظام التشغيل Windows. ستقوم أداة استخراج النص هذه باستخراج النص في النوافذ على الفور ، بنقرة واحدة.

أنظر أيضا