تحليل مستندات Word باستخدام REST API في Node.js

قد تحتاج إلى استخراج نص أو صور من مستندات Word الخاصة بك لأغراض مختلفة. يمكنك بسهولة تحليل مستندات Word وقراءة النص برمجيًا في تطبيقات Node.js. بصفتك مطور Node.js ، يمكنك استخراج كل النصوص والصور من ملفات DOCX برمجيًا على السحابة. ستركز هذه المقالة على كيفية تحليل مستندات Word باستخدام واجهة برمجة تطبيقات REST في Node.js.

سيتم تناول الموضوعات التالية في هذه المقالة:

محلل المستندات REST API و Node.js SDK

لتحليل وثائق DOCX ، سأستخدم Node.js SDK من GroupDocs.Parser Cloud API. يسمح لك بتحليل البيانات من أكثر من 50 نوعًا من المستندات. كما أنه يدعم تحليل الحاويات مثل أرشيفات ZIP وملفات بيانات البريد OST / PST والكتب الإلكترونية والعلامات وحافظات PDF في تطبيقات Node.js الخاصة بك. يمكنك استخراج النص والصور وتحليل البيانات بواسطة قالب باستخدام SDK. كما أنها توفر أدوات تطوير البرامج (SDKs).NET ، و Java ، و PHP ، و Ruby ، و Python باعتبارها أعضاء عائلة محلل المستندات لواجهة برمجة التطبيقات السحابية.

يمكنك تثبيت GroupDocs.Parser Cloud على تطبيق Node.js الخاص بك باستخدام الأمر التالي في وحدة التحكم:

npm install groupdocs-parser-cloud 

يرجى الحصول على معرف العميل والسرية من لوحة التحكم قبل اتباع الخطوات المذكورة. بمجرد حصولك على المعرف والسر الخاص بك ، قم بإضافة الرمز كما هو موضح أدناه:

global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";

const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";

تحليل مستندات Word واستخراج الصور باستخدام REST API في Node.js

يمكنك تحليل مستندات Word الخاصة بك واستخراج الصور برمجيًا باتباع الخطوات المذكورة أدناه:

قم بتحميل المستند

أولاً ، قم بتحميل مستند Word (DOCX) إلى السحابة باستخدام مثال الرمز الموضح أدناه:

// تهيئة API
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
let resourcesFolder = 'C:\\Files\\sample.docx';

// إقرا الملف
fs.readFile(resourcesFolder, (err, fileStream) => {
  // إنشاء طلب تحميل ملف
  let request = new groupdocs_parser_cloud.UploadFileRequest("sample.docx", fileStream, myStorage);
  // رفع ملف
  fileApi.uploadFile(request);
});

نتيجة لذلك ، سيكون ملف DOCX الذي تم تحميله متاحًا في قسم الملفات من لوحة المعلومات الخاصة بك على السحابة.

استخراج الصور من مستندات Word باستخدام Node.js

يمكنك بسهولة استخراج جميع الصور من مستندات Word باتباع الخطوات المذكورة أدناه.

  • إنشاء مثيل من ParseApi
  • قم بإنشاء مثيل FileInfo
  • اضبط المسار إلى ملف DOCX
  • قم بإنشاء مثيل ImageOptions
  • قم بتعيين FileInfo إلى ImageOptions
  • إنشاء طلبات الصور
  • احصل على النتائج عن طريق استدعاء طريقة ParseApi.images()

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج الصور من ملف DOCX باستخدام REST API.

// تهيئة API
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// معلومات ملف العينة
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";

// تحديد خيارات الصورة
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// إنشاء طلب صورة
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// الحصول على الصور
let result = await parseApi.images(request);

// عرض الصور مسار التنزيل
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
استخراج الصور من مستندات Word باستخدام Node.js

استخراج الصور من مستندات Word باستخدام Node.js

تنزيل الصور المستخرجة

نموذج الكود أعلاه سيحفظ الصور المستخرجة على السحابة. يمكنك تنزيل هذه الصور باستخدام نموذج الرمز الوارد أدناه:

// تهيئة api
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// إنشاء طلب تنزيل الملف
let request = new groupdocs_parser_cloud.DownloadFileRequest("parser/images/sample_docx/image_0.png", myStorage);

// تحميل الملف
let response = await fileApi.downloadFile(request);

// حفظ ملف الصورة في دليل العمل
fs.writeFile("C:\\Files\\images\\image_0.png", response, "binary", function (err) { });
console.log(response);

استخراج نص من مستندات Word باستخدام Node.js

يمكنك بسهولة استخراج كل النص من مستندات Word باتباع الخطوات المذكورة أدناه.

  • إنشاء مثيل من ParseApi
  • قم بإنشاء مثيل FileInfo
  • اضبط المسار إلى ملف DOCX
  • قم بإنشاء مثيل لـ TextOptions
  • قم بتعيين FileInfo إلى TextOptions
  • قم بتعيين رقم صفحة البداية
  • تحديد FormattedTextOptions
  • إنشاء TextRequest
  • احصل على النتائج عن طريق استدعاء الأسلوب ParseApi.text()

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج نص من ملف DOCX باستخدام REST API.

// تهيئة API
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// معلومات ملف العينة
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";

// تحديد خيارات النص
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 1;
options.formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions({
  mode: "Html"  // extract text in HTML
});

// إنشاء طلب نصي
let request = new groupdocs_parser_cloud.TextRequest(options);

// الحصول على النص
let result = await parseApi.text(request);

// إظهار النص المستخرج
let pages = result.pages;
pages.forEach(page => console.log(page.text));
استخراج نص من مستندات Word باستخدام Node.js

استخراج نص من مستندات Word باستخدام Node.js

جرب عبر الإنترنت

يرجى تجربة أداة تحليل DOCX المجانية التالية عبر الإنترنت ، والتي تم تطويرها باستخدام واجهة برمجة التطبيقات المذكورة أعلاه. https://products.groupdocs.app/parser/docx

خاتمة

في هذه المقالة ، تعلمت كيفية تحليل مستندات Word على السحابة. لقد تعلمت أيضًا كيفية استخراج الصور والنصوص من ملفات DOCX باستخدام واجهة برمجة تطبيقات REST في Node.js. توضح هذه المقالة أيضًا كيفية تحميل ملف DOCX برمجيًا على السحابة وتنزيل ملفات الصور من السحابة. يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. في حالة وجود أي غموض ، فلا تتردد في الاتصال بنا على المنتدى.

أنظر أيضا