
إذا كنت بحاجة لاستخراج نص عادي أو منظم من مستندات Microsoft Word لأغراض الأتمتة أو الفهرسة أو التحليل، فإن مجموعة GroupDocs.Parser Cloud SDK لـ Node.js توفر حلاً موثوقًا يعتمد على REST. مع بضع أسطر من الشيفرة، يمكنك استخراج المحتوى من .doc و .docx دون الحاجة لتثبيت Microsoft Word أو استخدام أي أدوات على جانب الخادم.
- API لاستخراج نص مستند Word
- كيفية استخراج النص من وورد باستخدام Node.js
- استخراج النص من Word عبر cURL
- مُستخرج نصوص الكلمات عبر الإنترنت
واجهة برمجة التطبيقات لاستخراج نص مستندات Word
تعتبر GroupDocs.Parser Cloud SDK for Node.js غلافًا لواجهة برمجة التطبيقات REST التي تبسط استخراج:
- Text (full document or selective pages).
- الجداول والبيانات المهيكلة.
- بيانات التعريف والحقول المضمنة.
- المرفقات والصور.
يدعم تنسيقات مختلفة، بما في ذلك PDF، Word، Excel، PowerPoint، MSG، ZIP، وأكثر.
المتطلبات الأساسية
- إنشاء حساب في GroupDocs.Cloud Dashboard.
- احصل على معرف العميل والسر الخاص بالعميل.
- قم بتثبيت SDK:
npm install groupdocs-parser-cloud
يمكنك التفكير في زيارة المقالة التالية لمعرفة المزيد عن، كيف تحصل على معرف العميل و السر السري للعميل من أجل المصادقة.
API استخراج نص من مستند Word
يرجى اتباع الخطوات الموضحة أدناه للحصول على معلومات حول كيفية استخراج النص من مستند Word باستخدام مجموعة تطوير البرمجيات Node.js.
الخطوة 1: تهيئة الإعدادات:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
الخطوة 2: إعداد معلومات الملف وخيارات النص: قم بتهيئة كائن من فئة TextRequest ومرر مثيل من فئة TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
الخطوة 3: استخراج النص من ملف Word: استدعِ text الطريقة، وستعيد محتوى النص العادي من مستند Word.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// للمزيد من الأمثلة، يرجى زيارة [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node)
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
يمكنك رؤية ناتج عينة الشفرة أعلاه في الصورة أدناه:

استخراج النص من Word عبر cURL
إذا كنت تفضل العمليات عبر سطر الأوامر أو تريد الدمج في نص؟ يمكنك استخراج النص من مستند Word باستخدام cURL و GroupDocs.Parser REST API.
الخطوة 1 – إنشاء رمز الوصول:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
الخطوة 2 – استخراج النص عبر استدعاء واجهة برمجة التطبيقات:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- استبدل بالرمز الذي أنشأته.
فوائد استخدام cURL مع واجهة برمجة التطبيقات GroupDocs.Parser
- ✅ لا حاجة لتثبيت SDK.
- ✅ أتمتة عبر المنصات.
- ✅ مثالي لبرامج الشل وسلاسل CI.
- ✅ فعال وخفيف الوزن.
أداة استخراج نص من مستندات وورد على الإنترنت
استخدم مستخرج النصوص من الكلمات المجاني عبر الإنترنت المدعوم من GroupDocs.Parser Cloud إذا كنت تفضل خيارًا بدون كود.

استنتاج
مع GroupDocs.Parser Cloud SDK لـ Node.js، يمكنك بسهولة استخراج النص من مستندات Word (.docx أو .doc) لأغراض الأتمتة أو الفهرسة أو استخراج البيانات. يوفر SDK و REST API خيارات مرنة وقابلة للتوسع، سواء كنت تفضل Node.js أو أوامر cURL المباشرة.
📚 موارد إضافية
الأسئلة الشائعة – FAQs
- يمكنني استخراج النص من جداول DOCX أيضًا؟
- نعم. يمكن لـ GroupDocs.Parser استخراج المحتوى المهيكل، بما في ذلك خلايا الجدول وبيانات التنسيق.
- Is Microsoft Word required?
- لا. يعمل واجهة برمجة التطبيقات في السحابة ولا يعتمد على مايكروسوفت أوفيس.
- ما هو نموذج التسعير؟
- نقدم نموذج تسعير دفع واحد حسب الاستخدام. لمزيد من المعلومات، يرجى زيارة pricing guide.
- هل يمكنني الحصول على تجربة مجانية؟
- نعم. بمجرد الاشتراك في حساب العرض التجريبي المجاني، يمكنك إجراء 150 مكالمة API شهريًا مجانًا. يرجى زيارة pricing guide لمزيد من التفاصيل.