
หากคุณต้องการดึงข้อมูลข้อความธรรมดาหรือข้อความที่มีโครงสร้างจากเอกสาร Microsoft Word สำหรับการทำงานอัตโนมัติ การจัดทำดัชนี หรือการวิเคราะห์ GroupDocs.Parser Cloud SDK สำหรับ Node.js นำเสนอวิธีแก้ปัญหา RESTful ที่เชื่อถือได้ ด้วยโค้ดเพียงไม่กี่บรรทัด คุณสามารถดึงเนื้อหาจาก .doc และ .docx ไฟล์โดยไม่ต้องติดตั้ง Microsoft Word หรือใช้เครื่องมือฝั่งเซิร์ฟเวอร์ใด ๆ
- API การดึงข้อมูลจากเอกสาร Word
- วิธีการดึงข้อความจาก Word โดยใช้ Node.js
- ดึงข้อความจาก Word ผ่าน cURL
- เครื่องมือแยกข้อความจากไฟล์ Word ออนไลน์
API การดึงข้อมูลจากเอกสาร Word
GroupDocs.Parser Cloud SDK for Node.js เป็น wrapper สำหรับ REST API ที่ทำให้การดึงข้อมูลง่ายขึ้น:
- Text (full document or selective pages).
- ตารางและข้อมูลที่มีโครงสร้าง.
- ข้อมูลเมตาและฟิลด์ฝังตัว.
- ไฟล์แนบและภาพถ่าย。
มันรองรับรูปแบบต่าง ๆ รวมถึง PDF, Word, Excel, PowerPoint, MSG, ZIP, และอื่น ๆ อีกมากมาย。
ข้อกำหนดเบื้องต้น
- สร้างบัญชีที่ GroupDocs.Cloud Dashboard.
- รับ Client ID และ Client Secret ของคุณค่ะ
- ติดตั้ง SDK:
npm install groupdocs-parser-cloud
คุณอาจพิจารณาเยี่ยมชมบทความดังต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ, วิธีการขอรับ Client ID และ Client Secret สำหรับการตรวจสอบสิทธิ์.
API การดึงข้อความจากเอกสาร Word
โปรดปฏิบัติตามขั้นตอนดังต่อไปนี้เพื่อข้อมูลเกี่ยวกับวิธีการแตกข้อความจากเอกสาร Word โดยใช้ Node.js SDK.
ขั้นตอนที่ 1: เริ่มต้นการตั้งค่า:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
ขั้นตอนที่ 2: ตั้งค่าข้อมูลไฟล์และตัวเลือกข้อความ: สร้างอ็อบเจ็กต์ของคลาส TextRequest และส่งผ่านตัวอย่างของคลาส TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
ขั้นตอนที่ 3: ดึงข้อความจากไฟล์ Word: เรียกใช้เมธอด text และมันจะส่งคืนเนื้อหาข้อความธรรมดาจากเอกสาร Word
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// เพื่อดูตัวอย่างเพิ่มเติม โปรดไปที่ https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
คุณสามารถดูผลลัพธ์ของตัวอย่างโค้ดข้างต้นได้ในภาพด้านล่าง:

Extract Text from Word via cURL
ถ้าคุณชอบการทำงานผ่าน command-line หรืออยากรวมเข้ากับสคริปต์ คุณสามารถดึงข้อมูลจากเอกสาร Word โดยใช้ cURL และ GroupDocs.Parser REST API.
ขั้นตอนที่ 1 – สร้างโทเค็นการเข้าถึง:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
ขั้นตอนที่ 2 – ดึงข้อความผ่านการเรียก API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- เปลี่ยน เป็นตัวที่คุณสร้างขึ้น
การใช้ cURL ร่วมกับ GroupDocs.Parser API มีข้อดีดังต่อไปนี้
- ✅ ไม่ต้องติดตั้ง SDK.
- ✅ การทำงานอัตโนมัติข้ามแพลตฟอร์ม.
- ✅ เหมาะสำหรับสคริปต์ shell & ท่อสาย CI.
- ✅ ประสิทธิภาพสูงและน้ำหนักเบา。
ตัวดึงข้อความออนไลน์
ใช้ Free Online Word Text Extractor ของเราซึ่งขับเคลื่อนโดย GroupDocs.Parser Cloud หากคุณต้องการตัวเลือกที่ไม่ต้องเขียนโค้ด

ข้อสรุป
ด้วย GroupDocs.Parser Cloud SDK สำหรับ Node.js คุณสามารถสกัดข้อความจากเอกสาร Word (.docx หรือ .doc) ได้อย่างง่ายดายสำหรับการทำงานอัตโนมัติ การจัดทำดัชนี หรือการทำเหมืองข้อมูล SDK และ REST API มอบตัวเลือกที่ยืดหยุ่นและสามารถปรับขนาดได้ ไม่ว่าคุณจะชอบ Node.js หรือคำสั่ง cURL โดยตรง
📚 แหล่งข้อมูลเพิ่มเติม
คำถามที่พบบ่อย – FAQs
- Can I extract text from DOCX tables too?
- ใช่. GroupDocs.Parser สามารถดึงข้อมูลที่มีโครงสร้าง รวมถึงเซลล์ของตารางและข้อมูลเลย์เอาต์ได้.
- Microsoft Word เป็นสิ่งที่จำเป็นหรือไม่?
- ไม่ใช่ API ทำงานในคลาวด์และไม่ขึ้นอยู่กับ Microsoft Office.
- โมเดลการตั้งราคาเป็นอย่างไร?
- เรามีโมเดลการกำหนดราคาแบบชำระเงินทีละรายการ สำหรับข้อมูลเพิ่มเติม โปรดเยี่ยมชม pricing guide.
- Can I have free trial?
- ใช่. เมื่อคุณสมัครสมาชิกบัญชีทดลองใช้งานฟรี คุณสามารถทำ API calls ได้ 150 ครั้งต่อเดือนฟรี กรุณาเยี่ยมชม pricing guide สำหรับรายละเอียดเพิ่มเติม.