Trích xuất hình ảnh từ Word trong Node.js - Trình trích xuất tệp hình ảnh

Tệp DOCX/DOC có thể chứa dữ liệu văn bản và hình ảnh lớn trong nhiều trường hợp. Nếu bạn cần trích xuất tất cả hình ảnh từ tệp Word và tách hình ảnh khỏi dữ liệu văn bản thì bạn có thể tận dụng API đám mây SDKREST do GroupDocs.Parser cung cấp. Trên thực tế, bạn có thể xây dựng trình trích xuất tệp hình ảnh trong JavaScript bằng cách sử dụng các phương thức được cung cấp bởi GroupDocs.Parser Cloud SDK cho Node.js. Vì vậy, hãy tiếp tục khám phá cách trích xuất hình ảnh từ Word trong Node.js. Ngoài ra, chúng ta sẽ thực hiện các bước và đoạn mã để triển khai chức năng.

Các điểm sau đây sẽ được đề cập:

Cài đặt phần mềm xử lý văn bản

Bước cài đặt của bất kỳ thư viện nào đều đóng một vai trò quan trọng trong việc phát triển ứng dụng nhanh chóng. May mắn thay, quá trình cài đặt GroupDocs.Parser Cloud SDK cho Node.js cũng giống như bạn cài đặt bất kỳ mô-đun Node.js nào bằng cách sử dụng npm install MODULENAME. Vì vậy, hãy chạy lệnh sau để cài đặt thư viện trình giải nén tệp hình ảnh giàu tính năng này:

npm install groupdocs-parser-cloud

Trong giai đoạn tiếp theo, chúng tôi sẽ thiết lập thư viện này với dự án Node.js của mình. Với mục đích này, chúng tôi sẽ lấy thông tin xác thực API (ID khách hàng, Bí mật khách hàng) từ Đám mây API trang tổng quan của chúng tôi.

Vui lòng truy cập hướng dẫn này trong trường hợp bạn gặp bất kỳ khó khăn nào trong việc lấy thông tin xác thực API.

Trích xuất hình ảnh từ Word trong Node.js

Chúng tôi có tệp DOC/DOCX nguồn trong trang tổng quan API Cloud mà bạn có thể tải lên theo cách thủ công hoặc theo chương trình bằng cách gọi phương thức UploadFile.

Các bước sau đây trình bày cách trích xuất hình ảnh từ Word trong Node.js:

  • Lấy groupdocs-parser-cloud trong dự án của bạn.
  • Khởi tạo một phiên bản của lớp Cấu hình với ID khách hàng và Bí mật khách hàng.
  • Gọi phương thức fromConfig và truyền đối tượng của lớp Cấu hình.
  • Tạo một đối tượng của lớp FileInfo và xác định đường dẫn của tệp DOCX nguồn.
  • Xác định các tùy chọn hình ảnh bằng cách tạo một thể hiện của lớp ImagesOptions.
  • Khởi tạo một đối tượng của lớp ImagesRequest và truyền phiên bản của lớp ImagesOptions.
  • Gọi phương thức images để trích xuất hình ảnh từ tài liệu Word.

Sao chép và dán đoạn mã sau để xây dựng phần mềm xử lý Word của riêng bạn:

// Lấy groupdocs-parser-cloud trong dự án của bạn.
const groupdocs_parser_cloud = require("groupdocs-parser-cloud");
// Xác định thông tin xác thực API của bạn.
let clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
let clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
// Khởi tạo một phiên bản của lớp Cấu hình bằng ID khách hàng và Bí mật khách hàng.
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
// Gọi phương thức fromConfig và truyền đối tượng của lớp Cấu hình.
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// Tạo một đối tượng của lớp FileInfo và xác định đường dẫn của tệp DOCX nguồn.
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// Xác định các tùy chọn hình ảnh bằng cách tạo một thể hiện của lớp ImagesOptions.
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// Khởi tạo một đối tượng của lớp ImagesRequest và truyền phiên bản của lớp ImagesOptions.
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// Gọi phương thức hình ảnh để trích xuất hình ảnh từ tài liệu Word.
parseApi.images(request)
.then((result)=>{
// Hiển thị kết quả
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
})

Bạn có thể thấy đầu ra của mẫu mã trên trong hình ảnh bên dưới:

trình trích xuất tập tin hình ảnh

Trình trích xuất hình ảnh trực tuyến

Bạn có thể tận dụng tối đa công cụ trực tuyến này để trích xuất hình ảnh từ tệp Word. Trên hết, nó còn được hỗ trợ bởi GroupDocs.Parser Cloud SDK. Ngoài ra, nó dựa trên web và cung cấp các tính năng thao tác và chuyển đổi mạnh mẽ vì nó miễn phí và không yêu cầu tạo hoặc đăng ký tài khoản.

Trình trích xuất hình ảnh trực tuyến

Phần kết luận

Cuối cùng, chúng ta có thể xem xét GroupDocs.Parser Cloud SDKs một cách an toàn để phát triển phần mềm xử lý văn bản. Nó khá dễ dàng để cài đặt và thiết lập và có rất nhiều phương pháp bạn có thể gọi. Ngoài ra, còn có một trình trích xuất hình ảnh trực tuyến để đạt được chức năng trực tuyến. Vui lòng truy cập tài liệu và kho lưu trữ GitHub để khám phá thêm. Hơn nữa, vui lòng truy cập Hướng dẫn bắt đầu để bắt đầu phát triển.

Cuối cùng, groupdocs.cloud đang viết bài mới. Vì vậy, hãy giữ liên lạc để cập nhật thường xuyên.

Trợ giúp có sẵn

Bạn có thể cho chúng tôi biết về các câu hỏi hoặc thắc mắc của bạn trên diễn đàn của chúng tôi.

Câu hỏi thường gặp – Câu hỏi thường gặp

Làm cách nào để trích xuất hình ảnh từ Word?

Bạn có thể sử dụng GroupDocs.Parser Cloud SDK để trích xuất hình ảnh từ tệp DOCX/DOC theo chương trình. Vui lòng truy cập liên kết này để biết thêm chi tiết.

Xem thêm