从 PDF 文档中提取图像是处理包含嵌入视觉的报告、扫描文档或演示文件时的常见需求。您可以使用 GroupDocs.Parser Cloud SDK for .NET 自动化提取过程,而不是手动保存每个图像。
在本教程中,您将学习如何使用 C# .NET 和 GroupDocs.Parser Cloud REST API 从 PDF 文件中提取图像,并提供易于遵循的代码片段以便快速集成。
为什么从PDF文件中提取图像?
自动化 PDF 图像提取有许多实际应用案例:
- 从市场营销或财务报告中提取标志、图表和信息图表。
- 从多页PDF中提取照片和扫描件。
- 建立用于文档分析的自动内容提取管道。
- 处理大量 PDF 文件,无需手动操作或桌面工具。
PDF 解析 API
GroupDocs.Parser Cloud SDK for .NET 是一个轻量级且易于集成的 API 封装,允许您提取结构化内容,例如文本、图像以及 PDF 及其他文件格式(包括 Word、Excel 等)的其他组件。
先决条件
在开始之前,请确保您已:
- 一个 GroupDocs Cloud Account 来获取您的客户端 ID 和客户端密钥。
- 在您的系统上安装 .NET 6.0 或更高版本。
- Visual Studio 或您喜欢的 IDE。
安装 PDF 解析器 API
您可以使用以下命令轻松地从 NuGet 安装 SDK:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
从 PDF 中提取图像使用 C# .NET
遵循以下简单步骤程序性地从 PDF 文件中提取所有图像。
步骤 1:设置配置。
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
步骤 2:指定文件信息。
var fileInfo = new FileInfo
{
FilePath = "sample.pdf"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
步骤 3:从 PDF 中提取图像。
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image Path: {image.Path}");
}
// 要获取更多示例,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
// 指定输入PDF信息
var fileInfo = new FileInfo
{
FilePath = "input.pdf"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// 创建图像提取请求
var request = new ImagesRequest(options);
// 从 PDF 中获取所有图像并放入响应对象中
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Extracted Image Path: {image.Path}");
}
通过 cURL 下载 PDF 图片
或者,您还可以使用 GroupDocs.Parser REST API 和 cURL 命令提取图像。
步骤 1 – 生成访问令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步骤 2 - 通过 REST API 提取图像:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"Binder1.pdf\", \"StorageName\": \"internal\" }, \"OutputPath\": \"internal\", \"StartPageNumber\": 1, \"CountPagesToExtract\": 2}"
- 将 替换为您生成的内容。
尝试在线 PDF 图像提取器
想在编码之前测试一下吗?使用由 GroupDocs.Parser Cloud 提供支持的免费 Online PDF Image Extractor —— 上传 PDF 并立即下载提取的图像。

结论
在本指南中,我们涵盖了如何:
- 使用 C# .NET REST API 从 PDF 中提取图像。
- 自动下载和处理嵌入图像。
- 使用 REST API 或 cURL 进行集成。
因此,借助 GroupDocs.Parser Cloud SDK for .NET,您可以轻松构建 PDF 内容提取的自动化工作流,无需第三方软件或手动步骤。
📚 额外资源
常见问题 – FAQs
如何从Word中提取图片?
您可以使用 GroupDocs.Parser Cloud SDKs 以编程方式从 Word 文件中提取图像。
定价模型是什么?
我们提供单一的按需付费定价模式。如需更多信息,请访问 pricing guide。
您提供免费试用吗?
是的。拥有免费试用账户,您可以每月免费进行 150 次 API 调用,并且可以无限制地评估我们的 API。有关更多信息,请访问 Free Trial。