Trích xuất hình ảnh PowerPoint từ tài liệu Word - Công cụ Trích xuất Hình ảnh

Nếu bạn có nhu cầu trích xuất hình ảnh nhúng từ tài liệu Word để lưu trữ, tự động hóa hoặc nhận diện hình ảnh? Sau đó, API REST Node.js của chúng tôi cung cấp một giải pháp mạnh mẽ và dựa trên đám mây để trích xuất hình ảnh từ .doc.docx mà không cần cài đặt Microsoft Word.

Nhu cầu trích xuất hình ảnh cũng có thể xảy ra nếu chúng ta cần:

  • Chụp lại đồ họa, biểu đồ và ảnh được nhúng trong báo cáo.
  • Tự động hóa việc trích xuất từ tài liệu quét hoặc mẫu.
  • Xây dựng bộ dữ liệu hình ảnh từ kho tài liệu.
  • Tiền xử lý nội dung cho các tác vụ OCR hoặc AI.

Hãy khám phá các chủ đề sau đây một cách chi tiết hơn:

API trích xuất hình ảnh từ tài liệu Word

Thư viện GroupDocs.Parser Cloud SDK for Node.js là một giải pháp dựa trên REST cung cấp khả năng phân tích tài liệu MS Word để thao tác nội dung. Không chỉ tài liệu Word, nó còn hỗ trợ việc trích xuất nội dung từ hầu hết tất cả các định dạng tài liệu kinh doanh phổ biến bao gồm (PPTX, Excel, PDF, ZIP, v.v.).

Điều kiện tiên quyết

  • Đăng ký tại GroupDocs Cloud Dashboard.
  • Lấy ID Khách hàng và Bí mật Khách hàng.
  • Cài đặt SDK dựa trên REST:
npm install groupdocs-parser-cloud
  • Để biết thêm thông tin về thông tin xác thực của khách hàng, vui lòng truy cập vào bài viết.

Cách trích xuất hình ảnh từ Word bằng Node.js

Làm theo các bước sau để phát triển một ứng dụng đơn giản và mạnh mẽ nhằm trích xuất hình ảnh từ tài liệu MS Word bằng cách sử dụng API Node.js:

Bước 1: Khởi tạo cấu hình.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Bước 2: Thiết lập thông tin tệp và tùy chọn hình ảnh. Khởi tạo một đối tượng của lớp ImagesRequest và truyền vào một thể hiện của lớp ImagesOptions.

const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Bước 3: Trích xuất hình ảnh từ tài liệu Word. Gọi phương pháp images để trích xuất hình ảnh từ tài liệu word trực tuyến.

parserApi.images(request).then((response) => {
    console.log("The Word document Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Để biết thêm ví dụ, vui lòng truy cập https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.images(request).then((response) => {
  console.log("The Word document Images extracted successfully.");
  console.log(response.images);
}).catch(err => {
    console.error("Failed to extract images:", err);
});

Bạn có thể xem đầu ra của mẫu mã ở trên trong hình dưới đây:

Một cái nhìn trước về việc trích xuất hình ảnh từ tài liệu Word bằng cách sử dụng API Node.js

Trích xuất hình ảnh từ Word thông qua cURL

Nếu bạn thích cách tiếp cận dòng lệnh để trích xuất các hình ảnh trong tài liệu Word bằng cách sử dụng lệnh cURL, thì GroupDocs.Parser Cloud hỗ trợ những khả năng này. Hãy cùng khám phá thêm tính năng này để đơn giản hóa yêu cầu về cách lấy hình ảnh từ tài liệu Word bằng cách sử dụng lệnh cURL.

Bước 1 – Tạo Mã Truy Cập:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Bước 2 – Trích xuất hình ảnh từ tệp Word:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • 🔐 Thay thế bằng cái mà bạn đã tạo.
  • Trong trường hợp bạn cần trích xuất hình ảnh từ toàn bộ tài liệu, chỉ cần bỏ qua các tham số StartPageNumber & CountPagesToExtract.

Thử Trình Trích Xuất Hình Ảnh Từ Từ Vựng Miễn Phí Trực Tuyến

Nếu bạn thích cách tiếp cận dựa trên giao diện người dùng để trích xuất hình ảnh từ tài liệu Word, thì bạn có thể xem xét việc sử dụng công cụ trực tuyến miễn phí Word Document Image Extractor được hỗ trợ bởi GroupDocs.Parser Cloud.

Trình trích xuất hình ảnh miễn phí

Kết luận

Với GroupDocs.Parser Cloud SDK cho Node.js, việc trích xuất hình ảnh từ các tập tin Word trở nên nhanh chóng và có thể mở rộng. Dù bạn cần xử lý hợp đồng, báo cáo, hay các biểu mẫu quét — API này đem lại cho bạn kiểm soát hoàn toàn việc trích xuất hình ảnh từ tài liệu Word.

📚 Tài nguyên bổ sung

Câu Hỏi Thường Gặp – FAQs

Có thể tôi trích xuất hình ảnh từ các trang cụ thể trong tài liệu Word không?

  • Có. Bạn có thể định nghĩa các tham số StartPageNumberCountPagesToExtract.

Các hình ảnh được trích xuất ở định dạng và độ phân giải gốc phải không?

  • Vâng. API trả về các hình ảnh nhúng như chúng có trong tài liệu.

Do I need Microsoft Word installed?

  • Không. Đây là một giải pháp dựa trên đám mây và hoạt động độc lập với MS Office.

Có một bản dùng thử miễn phí không?

  • Vâng. Bạn có thể nhận 150 cuộc gọi API miễn phí mỗi tháng với tài khoản dùng thử. Để biết thêm thông tin, vui lòng truy cập pricing guide.

Bài viết liên quan