Các tài liệu Word thường chứa các yếu tố hình ảnh phong phú như logo, biểu đồ và hình ảnh sản phẩm mà bạn có thể cần sử dụng lại hoặc phân tích riêng biệt. Việc lưu từng hình ảnh từ một .doc hoặc .docx tệp một cách thủ công có thể chậm và dễ xảy ra lỗi — đặc biệt là khi xử lý các tài liệu số lượng lớn hoặc quy trình làm việc tự động.
Vì vậy, trong bài viết này, chúng ta sẽ tìm hiểu chi tiết về cách chúng ta có thể lập trình để trích xuất hình ảnh từ tài liệu Word bằng một vài cuộc gọi API đơn giản. SDK dựa trên REST của chúng tôi hoàn toàn hoạt động trên đám mây — mà không cần Microsoft Word hay thư viện bên ngoài — làm cho nó trở nên lý tưởng cho tự động hóa, tích hợp và các ứng dụng có thể mở rộng.
Các tính năng nổi bật của việc trích xuất hình ảnh
- Lưu trữ hình ảnh tài liệu vào một thư viện phương tiện tập trung
- Xử lý đồ họa nhúng cho các quy trình làm việc machine learning hoặc OCR.
- Tái sử dụng tài sản của công ty từ các báo cáo và hợp đồng
- Di chuyển dữ liệu hình ảnh giữa các hệ thống tài liệu
Hãy cùng khám phá các chủ đề sau một cách chi tiết hơn:
- API Xử Lý Tài Liệu Word
- Cách trích xuất hình ảnh từ Word trong C#
- Tải hình ảnh tài liệu Word bằng cách sử dụng cURL
- Trình trích xuất hình ảnh tài liệu Word miễn phí
API xử lý tài liệu Word
SDK GroupDocs.Parser Cloud cho .NET của chúng tôi là API dựa trên REST được trao giải, cung cấp khả năng thao tác với nhiều định dạng tệp khác nhau bao gồm Tài liệu Word, PPTX, Excel, PDF, ZIP v.v. Theo yêu cầu của chúng tôi, API đơn giản hóa những trường hợp sử dụng này bằng cách cho phép bạn đọc, trích xuất và lưu hình ảnh trực tiếp từ các tệp .doc
và .docx
trong các ứng dụng C# của bạn.
Điều kiện tiên quyết
- Đăng ký tại GroupDocs Cloud Dashboard.
- Lấy Mã ID Khách hàng và Mã bí mật Khách hàng. Để biết thêm chi tiết, vui lòng truy cập bài viết này article.
- Cài đặt SDK dựa trên REST:
- Cài đặt .NET 6.0 hoặc phiên bản mới hơn và Visual Studio.
Cài đặt SDK từ các gói NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
- Để biết thêm thông tin về thông tin xác thực của khách hàng,
Cách trích xuất hình ảnh từ Word trong C#
Làm theo quy trình đơn giản ba bước dưới đây để trích xuất hình ảnh từ tài liệu Word bằng cách sử dụng C# và GroupDocs.Parser Cloud REST API.
Bước 1: Khởi tạo cấu hình API
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
Bước 2: Đặt Đường Dẫn Tệp và Tùy Chọn Trích Xuất Khởi tạo một đối tượng của đối tượng ImagesRequest, trong đó chúng ta truyền tham số là phiên bản của lớp ImagesOptions.
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
Bước 3: Lấy hình ảnh tài liệu. Kích hoạt API images để trích xuất hình ảnh từ tài liệu Word.
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
// write the name of image extracted from word document
Console.WriteLine($"Image found at: {image.Path}");
}
// Để biết thêm thông tin, vui lòng truy cập https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
// specify the input Word document information
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// Tạo đối tượng ImagesRequest
var request = new ImagesRequest(options);
// Call the API to extract images from Word document
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image found at: {image.Path}");
}
Tải hình ảnh tài liệu Word bằng cURL
Nếu bạn ưu tiên việc trích xuất hình ảnh mà không cần mã nguồn, hãy thử gọi GroupDocs.Parser Cloud bằng cách sử dụng lệnh cURL từ terminal dòng lệnh hoặc tệp lệnh hàng loạt.
Bước 1 – Tạo JWTAccess Token:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Bước 2 – Trích xuất Hình ảnh:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- Thay thế bằng cái mà bạn đã tạo ra.
- Nếu bạn muốn trích xuất hình ảnh từ tất cả các trang, hãy bỏ qua các tham số
StartPageNumber
vàCountPagesToExtract
.
Trình trích xuất hình ảnh tài liệu Word miễn phí
Nếu bạn chưa thiết lập môi trường của mình và muốn kiểm tra khả năng của GroupDocs.Parser Cloud API, thì bạn có thể xem xét việc thử ứng dụng miễn phí online Word Image Extractor.

Tóm tắt
SDK Cloud GroupDocs.Parser for .NET là một giải pháp đáng tin cậy cho việc trích xuất nội dung, phân tích tài liệu và quy trình tự động liên quan đến các định dạng Word, PDF, Excel và các định dạng khác. Hãy thử sử dụng REST API của chúng tôi hôm nay!
Đọc thêm
Câu hỏi thường gặp – FAQs
Có thể tôi trích xuất hình ảnh từ các trang cụ thể trong tài liệu Word không?
- Vâng. Bạn có thể định nghĩa các tham số
StartPageNumber
vàCountPagesToExtract
.
Liệu API có giữ nguyên độ phân giải của hình ảnh không?
- Có. API trả về hình ảnh nhúng với chất lượng và độ phân giải tương tự như khi chúng được nhúng trong tài liệu Word.
Có cần Microsoft Word để thực hiện thao tác này không?
- Không. Đây là một giải pháp dựa trên đám mây và hoạt động độc lập với MS Office.
Có một bản dùng thử miễn phí không?
- Vâng. Bạn có thể nhận 150 cuộc gọi API miễn phí mỗi tháng với một tài khoản dùng thử. Để biết thêm thông tin, vui lòng truy cập pricing guide.