از مستند ورد متن استخراج کنید با استفاده از API Node.js - استخراج کننده متن

اگر نیاز دارید که متن ساده یا ساختار یافته را از اسناد مایکروسافت ورد برای اتوماسیون، نمایه سازی یا تجزیه و تحلیل استخراج کنید، GroupDocs.Parser Cloud SDK برای Node.js یک راه حل RESTful قابل اعتماد ارائه می دهد. با تنها چند خط کد، می توانید محتوا را از .doc و .docx فایل ها بدون نصب مایکروسافت ورد یا استفاده از هر ابزار سمت سرور استخراج کنید.

API استخراج متن از سند ورد

GroupDocs.Parser Cloud SDK for Node.js یک لایه برای REST API است که استخراج را ساده می‌کند:

  • متن (مدرک کامل یا صفحات انتخابی).
  • جداول و داده‌های ساختار یافته.
  • متادیتا و فیلدهای درون‌ساخته.
  • پیوندها و تصاویر.

این فرمت‌های مختلفی را پشتیبانی می‌کند، از جمله PDF، Word، Excel، PowerPoint، MSG، ZIP و بیشتر.

پیش نیازها

  1. یک حساب کاربری در GroupDocs.Cloud Dashboard ایجاد کنید.
  2. Client ID و Client Secret خود را دریافت کنید.
  3. نصب SDK:
npm install groupdocs-parser-cloud

شما می‌توانید به مقاله زیر مراجعه کنید تا بیشتر در مورد چگونگی دریافت شناسه مشتری و کلید مخفی مشتری برای احراز هویت بیاموزید.

API استخراج متن از سند ورد

لطفاً مراحل زیر را برای اطلاعات در مورد نحوه استخراج متن از یک سند ورد با استفاده از Node.js SDK دنبال کنید.

مرحله ۱: راه‌اندازی پیکربندی:

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

مرحله ۲: تنظیمات اطلاعات فایل و گزینه‌های متن: یک شیء از کلاس TextRequest را مقداردهی اولیه کنید و نمونه‌ای از کلاس TextOptions را به آن پاس دهید.

const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

گام ۳: استخراج متن از فایل ورد: متد text را فراخوانی کنید، و این متد محتوای متن ساده را از سند ورد باز می‌گرداند.

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});
// برای مشاهده مثال‌های بیشتر، لطفاً به [https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node](https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node) مراجعه کنید.
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// مسیر سند ورد
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});

شما می‌توانید خروجی کد نمونه بالا را در تصویر زیر مشاهده کنید:

متن سند ورد را استخراج کنید

Extract Text from Word via cURL

اگر شما عملیات خط فرمان را ترجیح می‌دهید یا می‌خواهید آن را در یک اسکریپت ادغام کنید؟ شما می‌توانید متن را از سند Word با استفاده از cURL و GroupDocs.Parser REST API استخراج کنید.

گام 1 - تولید توکن دسترسی:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Step 2 – Extract Text via API Call:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d 
    "{  
        \"FileInfo\": 
        {
            \"FilePath\": \"sample.docx\",
            \"StorageName\": \"internal\"
        },
        \"StartPageNumber\": 0,
        \"CountPagesToExtract\": 1
    }"
  • را با آن چیزی که شما تولید کرده‌اید جایگزین کنید.

مزایای استفاده از cURL با GroupDocs.Parser API

  • ✅ نصب SDK لازم نیست.
  • ✅ اتوماسیون چند پلتفرمی.
  • ✅ ایده‌آل برای اسکریپت‌های شل و پایپ‌لاین‌های CI.
  • ✅ کارآمد و سبک.

اکسترکتور متن آنلاین

از Free Online Word Text Extractor ما که توسط GroupDocs.Parser Cloud پشتیبانی می‌شود، استفاده کنید اگر گزینه بدون کد را ترجیح می‌دهید.

استخراج متن آنلاین ورد

نتیجه‌گیری

با GroupDocs.Parser Cloud SDK برای Node.js، می‌توانید به سادگی متن را از مدارک Word (.docx یا .doc) برای اتوماسیون، فهرست‌سازی یا داده‌کاوی استخراج کنید. SDK و REST API گزینه‌های منعطف و مقیاس‌پذیری را ارائه می‌دهند، چه Node.js را ترجیح دهید و چه دستورات cURL مستقیم.

📚 منابع اضافی

سؤالات متداول – FAQs

  1. آیا می‌توانم متن را از جداول DOCX نیز استخراج کنم؟
  • بله. GroupDocs.Parser می‌تواند محتوای ساختاریافته، از جمله سلول‌های جدول و داده‌های چیدمان را استخراج کند.
  1. آیا Microsoft Word لازم است؟
  • نه. API در Cloud اجرا می‌شود و به Microsoft Office وابسته نیست.
  1. مدل قیمت گذاری چیست؟
  • ما یک مدل قیمت گذاری پرداخت به ازای استفاده ارائه می دهیم. برای اطلاعات بیشتر، لطفاً به pricing guide مراجعه کنید.
  1. آیا می‌توانم دوره آزمایشی رایگان داشته باشم؟
  • بله. هنگامی که به حساب آزمایشی رایگان مشترک شوید، می‌توانید ۱۵۰ تماس API در ماه به صورت رایگان انجام دهید. لطفاً برای جزئیات بیشتر به pricing guide مراجعه کنید.

مقالات پیشنهادی