
اگر نیاز دارید که متن ساده یا ساختار یافته را از اسناد مایکروسافت ورد برای اتوماسیون، نمایه سازی یا تجزیه و تحلیل استخراج کنید، GroupDocs.Parser Cloud SDK برای Node.js یک راه حل RESTful قابل اعتماد ارائه می دهد. با تنها چند خط کد، می توانید محتوا را از .doc و .docx فایل ها بدون نصب مایکروسافت ورد یا استفاده از هر ابزار سمت سرور استخراج کنید.
- API استخراج متن اسناد Word
- چگونه متن را از ورد با استفاده از Node.js استخراج کنیم
- متن را از ورد از طریق cURL استخراج کنید
- استخراج متن کلمه آنلاین
API استخراج متن از سند ورد
GroupDocs.Parser Cloud SDK for Node.js یک لایه برای REST API است که استخراج را ساده میکند:
- متن (مدرک کامل یا صفحات انتخابی).
- جداول و دادههای ساختار یافته.
- متادیتا و فیلدهای درونساخته.
- پیوندها و تصاویر.
این فرمتهای مختلفی را پشتیبانی میکند، از جمله PDF، Word، Excel، PowerPoint، MSG، ZIP و بیشتر.
پیش نیازها
- یک حساب کاربری در GroupDocs.Cloud Dashboard ایجاد کنید.
- Client ID و Client Secret خود را دریافت کنید.
- نصب SDK:
npm install groupdocs-parser-cloud
شما میتوانید به مقاله زیر مراجعه کنید تا بیشتر در مورد چگونگی دریافت شناسه مشتری و کلید مخفی مشتری برای احراز هویت بیاموزید.
API استخراج متن از سند ورد
لطفاً مراحل زیر را برای اطلاعات در مورد نحوه استخراج متن از یک سند ورد با استفاده از Node.js SDK دنبال کنید.
مرحله ۱: راهاندازی پیکربندی:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
مرحله ۲: تنظیمات اطلاعات فایل و گزینههای متن: یک شیء از کلاس TextRequest را مقداردهی اولیه کنید و نمونهای از کلاس TextOptions را به آن پاس دهید.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
گام ۳: استخراج متن از فایل ورد: متد text را فراخوانی کنید، و این متد محتوای متن ساده را از سند ورد باز میگرداند.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// برای مشاهده مثالهای بیشتر، لطفاً به [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node) مراجعه کنید.
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// مسیر سند ورد
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
شما میتوانید خروجی کد نمونه بالا را در تصویر زیر مشاهده کنید:

Extract Text from Word via cURL
اگر شما عملیات خط فرمان را ترجیح میدهید یا میخواهید آن را در یک اسکریپت ادغام کنید؟ شما میتوانید متن را از سند Word با استفاده از cURL و GroupDocs.Parser REST API استخراج کنید.
گام 1 - تولید توکن دسترسی:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Step 2 – Extract Text via API Call:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- را با آن چیزی که شما تولید کردهاید جایگزین کنید.
مزایای استفاده از cURL با GroupDocs.Parser API
- ✅ نصب SDK لازم نیست.
- ✅ اتوماسیون چند پلتفرمی.
- ✅ ایدهآل برای اسکریپتهای شل و پایپلاینهای CI.
- ✅ کارآمد و سبک.
اکسترکتور متن آنلاین
از Free Online Word Text Extractor ما که توسط GroupDocs.Parser Cloud پشتیبانی میشود، استفاده کنید اگر گزینه بدون کد را ترجیح میدهید.

نتیجهگیری
با GroupDocs.Parser Cloud SDK برای Node.js، میتوانید به سادگی متن را از مدارک Word (.docx یا .doc) برای اتوماسیون، فهرستسازی یا دادهکاوی استخراج کنید. SDK و REST API گزینههای منعطف و مقیاسپذیری را ارائه میدهند، چه Node.js را ترجیح دهید و چه دستورات cURL مستقیم.
📚 منابع اضافی
سؤالات متداول – FAQs
- آیا میتوانم متن را از جداول DOCX نیز استخراج کنم؟
- بله. GroupDocs.Parser میتواند محتوای ساختاریافته، از جمله سلولهای جدول و دادههای چیدمان را استخراج کند.
- آیا Microsoft Word لازم است؟
- نه. API در Cloud اجرا میشود و به Microsoft Office وابسته نیست.
- مدل قیمت گذاری چیست؟
- ما یک مدل قیمت گذاری پرداخت به ازای استفاده ارائه می دهیم. برای اطلاعات بیشتر، لطفاً به pricing guide مراجعه کنید.
- آیا میتوانم دوره آزمایشی رایگان داشته باشم؟
- بله. هنگامی که به حساب آزمایشی رایگان مشترک شوید، میتوانید ۱۵۰ تماس API در ماه به صورت رایگان انجام دهید. لطفاً برای جزئیات بیشتر به pricing guide مراجعه کنید.