PDF 文档中提取图像是处理包含嵌入视觉的报告、扫描文档或演示文件时的常见需求。您可以使用 GroupDocs.Parser Cloud SDK for .NET 自动化提取过程,而不是手动保存每个图像。

在本教程中,您将学习如何使用 C# .NET 和 GroupDocs.Parser Cloud REST API 从 PDF 文件中提取图像,并提供易于遵循的代码片段以便快速集成。

为什么从PDF文件中提取图像?

自动化 PDF 图像提取有许多实际应用案例:

  • 从市场营销或财务报告中提取标志、图表和信息图表。
  • 从多页PDF中提取照片和扫描件。
  • 建立用于文档分析的自动内容提取管道。
  • 处理大量 PDF 文件,无需手动操作或桌面工具。

PDF 解析 API

GroupDocs.Parser Cloud SDK for .NET 是一个轻量级且易于集成的 API 封装,允许您提取结构化内容,例如文本、图像以及 PDF 及其他文件格式(包括 Word、Excel 等)的其他组件。

先决条件

在开始之前,请确保您已:

  • 一个 GroupDocs Cloud Account 来获取您的客户端 ID 和客户端密钥。
  • 在您的系统上安装 .NET 6.0 或更高版本。
  • Visual Studio 或您喜欢的 IDE。

安装 PDF 解析器 API

您可以使用以下命令轻松地从 NuGet 安装 SDK:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

从 PDF 中提取图像使用 C# .NET

遵循以下简单步骤程序性地从 PDF 文件中提取所有图像。

步骤 1:设置配置。

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

步骤 2:指定文件信息。

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

步骤 3:从 PDF 中提取图像。

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// 要获取更多示例,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// 指定输入PDF信息
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// 创建图像提取请求
var request = new ImagesRequest(options);

// 从 PDF 中获取所有图像并放入响应对象中
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

通过 cURL 下载 PDF 图片

或者,您还可以使用 GroupDocs.Parser REST API 和 cURL 命令提取图像。

步骤 1 – 生成访问令牌:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步骤 2 - 通过 REST API 提取图像:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • 将 替换为您生成的内容。

尝试在线 PDF 图像提取器

想在编码之前测试一下吗?使用由 GroupDocs.Parser Cloud 提供支持的免费 Online PDF Image Extractor —— 上传 PDF 并立即下载提取的图像。

免费图像提取器

结论

在本指南中,我们涵盖了如何:

  • 使用 C# .NET REST API 从 PDF 中提取图像。
  • 自动下载和处理嵌入图像。
  • 使用 REST API 或 cURL 进行集成。

因此,借助 GroupDocs.Parser Cloud SDK for .NET,您可以轻松构建 PDF 内容提取的自动化工作流,无需第三方软件或手动步骤。

📚 额外资源

常见问题 – FAQs

如何从Word中提取图片?

您可以使用 GroupDocs.Parser Cloud SDKs 以编程方式从 Word 文件中提取图像。

定价模型是什么?

我们提供单一的按需付费定价模式。如需更多信息,请访问 pricing guide

您提供免费试用吗?

是的。拥有免费试用账户,您可以每月免费进行 150 次 API 调用,并且可以无限制地评估我们的 API。有关更多信息,请访问 Free Trial

相关的文章