Trích xuất hình ảnh từ PDF tài liệu là một yêu cầu phổ biến khi xử lý báo cáo, tài liệu quét, hoặc các tệp trình bày có chứa hình ảnh nhúng. Thay vì lưu từng hình ảnh một cách thủ công, bạn có thể tự động hóa quá trình trích xuất với GroupDocs.Parser Cloud SDK cho .NET.
Trong hướng dẫn này, bạn sẽ học cách trích xuất hình ảnh từ các tệp PDF sử dụng C# .NET và GroupDocs.Parser Cloud REST API, cùng với các đoạn mã dễ hiểu để tích hợp nhanh chóng.
- Tại sao trích xuất hình ảnh từ các tệp PDF
- API phân tích PDF
- Trích xuất hình ảnh từ PDF bằng C# .NET
- Tải hình ảnh PDF qua cURL
- Hãy thử Trình trích xuất hình ảnh PDF trực tuyến
Tại sao phải trích xuất hình ảnh từ tệp PDF?
Có nhiều trường hợp sử dụng thực tế cho việc tự động hóa việc trích xuất hình ảnh từ PDF:
- Retrieve logos, charts, and infographics from marketing or financial reports.
- Trích xuất ảnh và quét từ PDF nhiều trang.
- Xây dựng các quy trình trích xuất nội dung tự động cho phân tích tài liệu.
- Xử lý các lô PDF lớn mà không cần nỗ lực thủ công hoặc công cụ trên máy tính để bàn.
API phân tích PDF
GroupDocs.Parser Cloud SDK for .NET là một lớp bao API nhẹ và dễ tích hợp cho phép bạn trích xuất nội dung có cấu trúc - chẳng hạn như văn bản, hình ảnh và các thành phần khác của PDF cũng như các định dạng tệp khác bao gồm Word, Excel, v.v.
Điều kiện tiên quyết
Trước khi bắt đầu, hãy đảm bảo bạn đã có:
- Một GroupDocs Cloud Account để lấy Client ID và Client Secret của bạn.
- .NET 6.0 hoặc phiên bản mới hơn được cài đặt trên hệ thống của bạn.
- Visual Studio hoặc IDE bạn ưu thích.
Cài đặt API phân tích PDF
Bạn có thể dễ dàng cài đặt SDK từ NuGet bằng cách sử dụng lệnh bên dưới:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Trích xuất hình ảnh từ PDF bằng C# .NET
Làm theo những bước đơn giản này để trích xuất tất cả hình ảnh từ tệp PDF một cách lập trình.
Bước 1: Thiết lập Cấu hình.
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
Bước 2: Chỉ định Thông tin Tệp.
var fileInfo = new FileInfo
{
FilePath = "sample.pdf"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
Bước 3: Trích xuất hình ảnh từ PDF.
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image Path: {image.Path}");
}
// Để biết thêm ví dụ, vui lòng truy cập https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
// chỉ định thông tin PDF đầu vào
var fileInfo = new FileInfo
{
FilePath = "input.pdf"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// tạo yêu cầu Trích xuất Hình ảnh
var request = new ImagesRequest(options);
// lấy tất cả hình ảnh từ PDF trong đối tượng phản hồi
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Extracted Image Path: {image.Path}");
}
Tải hình ảnh PDF qua cURL
Ngoài ra, bạn cũng có thể trích xuất hình ảnh bằng cách sử dụng GroupDocs.Parser REST API và lệnh cURL.
Bước 1 – Tạo Mã Truy Cập:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Bước 2 – Trích xuất Hình ảnh qua REST API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- Thay thế bằng cái mà bạn đã tạo ra.
Hãy thử Trình trích xuất hình ảnh PDF trực tuyến
Muốn thử nghiệm trước khi lập trình? Sử dụng Trình trích xuất hình ảnh PDF trực tuyến miễn phí được cung cấp bởi GroupDocs.Parser Cloud — tải lên một PDF và ngay lập tức tải xuống các hình ảnh đã trích xuất.

Kết luận
Trong hướng dẫn này, chúng tôi đã đề cập đến cách:
- Trích xuất hình ảnh từ PDF sử dụng C# .NET REST API.
- Tải về và xử lý các hình ảnh nhúng một cách tự động.
- Sử dụng REST API hoặc cURL để tích hợp.
Vì vậy, với sự giúp đỡ của GroupDocs.Parser Cloud SDK cho .NET, bạn có thể dễ dàng xây dựng quy trình tự động hóa để trích xuất nội dung PDF mà không cần phần mềm bên thứ ba hoặc các bước thủ công.
📚 Tài nguyên bổ sung
Câu hỏi thường gặp – FAQs
Làm thế nào để tôi trích xuất hình ảnh từ Word?
Bạn có thể sử dụng GroupDocs.Parser Cloud SDKs để trích xuất hình ảnh từ các tệp Word một cách lập trình.
Mô hình định giá là gì?
Chúng tôi cung cấp một mô hình giá tính theo từng lần sử dụng. Để biết thêm thông tin, vui lòng truy cập pricing guide.
Bạn có cung cấp bản dùng thử miễn phí không?
Có. Với tài khoản dùng thử miễn phí, bạn có thể thực hiện 150 cuộc gọi API mỗi tháng miễn phí và đánh giá các API của chúng tôi mà không có hạn chế. Để biết thêm thông tin, vui lòng truy cập Free Trial.