
Nếu bạn có nhu cầu trích xuất hình ảnh nhúng từ tài liệu Word để lưu trữ, tự động hóa hoặc nhận diện hình ảnh? Sau đó, API REST Node.js của chúng tôi cung cấp một giải pháp mạnh mẽ và dựa trên đám mây để trích xuất hình ảnh từ .doc và .docx mà không cần cài đặt Microsoft Word.
Nhu cầu trích xuất hình ảnh cũng có thể xảy ra nếu chúng ta cần:
- Chụp lại đồ họa, biểu đồ và ảnh được nhúng trong báo cáo.
- Tự động hóa việc trích xuất từ tài liệu quét hoặc mẫu.
- Xây dựng bộ dữ liệu hình ảnh từ kho tài liệu.
- Tiền xử lý nội dung cho các tác vụ OCR hoặc AI.
Hãy khám phá các chủ đề sau đây một cách chi tiết hơn:
- API trích xuất hình ảnh tài liệu Word
- Cách trích xuất hình ảnh từ Word bằng Node.js
- Trích xuất hình ảnh từ Word qua cURL
- Thử Trình Trích Xuất Hình Ảnh Từ Từ Điển Trực Tuyến Miễn Phí
API trích xuất hình ảnh từ tài liệu Word
Thư viện GroupDocs.Parser Cloud SDK for Node.js là một giải pháp dựa trên REST cung cấp khả năng phân tích tài liệu MS Word để thao tác nội dung. Không chỉ tài liệu Word, nó còn hỗ trợ việc trích xuất nội dung từ hầu hết tất cả các định dạng tài liệu kinh doanh phổ biến bao gồm (PPTX, Excel, PDF, ZIP, v.v.).
Điều kiện tiên quyết
- Đăng ký tại GroupDocs Cloud Dashboard.
- Lấy ID Khách hàng và Bí mật Khách hàng.
- Cài đặt SDK dựa trên REST:
npm install groupdocs-parser-cloud
- Để biết thêm thông tin về thông tin xác thực của khách hàng, vui lòng truy cập vào bài viết.
Cách trích xuất hình ảnh từ Word bằng Node.js
Làm theo các bước sau để phát triển một ứng dụng đơn giản và mạnh mẽ nhằm trích xuất hình ảnh từ tài liệu MS Word bằng cách sử dụng API Node.js:
Bước 1: Khởi tạo cấu hình.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Bước 2: Thiết lập thông tin tệp và tùy chọn hình ảnh. Khởi tạo một đối tượng của lớp ImagesRequest và truyền vào một thể hiện của lớp ImagesOptions.
const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Bước 3: Trích xuất hình ảnh từ tài liệu Word. Gọi phương pháp images để trích xuất hình ảnh từ tài liệu word trực tuyến.
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// Để biết thêm ví dụ, vui lòng truy cập https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch(err => {
console.error("Failed to extract images:", err);
});
Bạn có thể xem đầu ra của mẫu mã ở trên trong hình dưới đây:

Trích xuất hình ảnh từ Word thông qua cURL
Nếu bạn thích cách tiếp cận dòng lệnh để trích xuất các hình ảnh trong tài liệu Word bằng cách sử dụng lệnh cURL, thì GroupDocs.Parser Cloud hỗ trợ những khả năng này. Hãy cùng khám phá thêm tính năng này để đơn giản hóa yêu cầu về cách lấy hình ảnh từ tài liệu Word bằng cách sử dụng lệnh cURL.
Bước 1 – Tạo Mã Truy Cập:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Bước 2 – Trích xuất hình ảnh từ tệp Word:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 🔐 Thay thế bằng cái mà bạn đã tạo.
- Trong trường hợp bạn cần trích xuất hình ảnh từ toàn bộ tài liệu, chỉ cần bỏ qua các tham số
StartPageNumber
&CountPagesToExtract
.
Thử Trình Trích Xuất Hình Ảnh Từ Từ Vựng Miễn Phí Trực Tuyến
Nếu bạn thích cách tiếp cận dựa trên giao diện người dùng để trích xuất hình ảnh từ tài liệu Word, thì bạn có thể xem xét việc sử dụng công cụ trực tuyến miễn phí Word Document Image Extractor được hỗ trợ bởi GroupDocs.Parser Cloud.

Kết luận
Với GroupDocs.Parser Cloud SDK cho Node.js, việc trích xuất hình ảnh từ các tập tin Word trở nên nhanh chóng và có thể mở rộng. Dù bạn cần xử lý hợp đồng, báo cáo, hay các biểu mẫu quét — API này đem lại cho bạn kiểm soát hoàn toàn việc trích xuất hình ảnh từ tài liệu Word.
📚 Tài nguyên bổ sung
Câu Hỏi Thường Gặp – FAQs
Có thể tôi trích xuất hình ảnh từ các trang cụ thể trong tài liệu Word không?
- Có. Bạn có thể định nghĩa các tham số
StartPageNumber
vàCountPagesToExtract
.
Các hình ảnh được trích xuất ở định dạng và độ phân giải gốc phải không?
- Vâng. API trả về các hình ảnh nhúng như chúng có trong tài liệu.
Do I need Microsoft Word installed?
- Không. Đây là một giải pháp dựa trên đám mây và hoạt động độc lập với MS Office.
Có một bản dùng thử miễn phí không?
- Vâng. Bạn có thể nhận 150 cuộc gọi API miễn phí mỗi tháng với tài khoản dùng thử. Để biết thêm thông tin, vui lòng truy cập pricing guide.