Word 文档通常包含丰富的视觉元素,如徽标、图表和产品图片,您可能需要单独重用或分析这些元素。手动从 .doc 或 .docx 文件中保存每个图像可能会很慢且容易出错——尤其是在处理大量文档或自动化工作流程时。
因此,在本文中,我们将学习如何通过简单的API调用以编程方式从Word文档中提取图像的详细信息。我们的基于REST的SDK完全在云端工作——无需Microsoft Word或外部库——使其非常适合自动化、集成和可扩展的应用程序。
图像提取的显著特征
- 将文档视觉效果归档到集中式媒体库中
- 处理机器学习或OCR工作流中的嵌入图形
- 从报告和合同中重新利用公司资产
- 在文档系统之间迁移视觉数据
让我们更详细地探讨以下主题:
Word 文档处理 API
The GroupDocs.Parser Cloud SDK for .NET 是我们获奖的基于 REST 的 API,提供处理各种文件格式的能力,包括 Word 文档、 PPTX、 Excel、 PDF、 ZIP 等。根据我们的要求,API 通过让您在 C# 应用程序中直接从 .doc 和 .docx 文件中读取、提取和保存图片来简化这些用例。
先决条件
- 在 GroupDocs Cloud Dashboard 注册。
- 获取您的客户端ID和客户端密钥。有关更多详细信息,请访问这 article。
- 安装基于 REST 的 SDK:
- 安装 .NET 6.0 或更高版本以及 Visual Studio。
从 NuGet 包中安装 SDK:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
- 有关客户端凭据的更多信息,
如何在 C# 中从 Word 中提取图像
按照下面简单的三步流程使用 C# 和 GroupDocs.Parser Cloud REST API 从 Word 文档中提取图像。
步骤 1:初始化 API 配置
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
步骤 2:设置文件路径和提取选项 初始化一个 ImagesRequest 对象,并将 ImagesOptions 类的实例作为参数传递。
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
步骤 3:检索文档图像。 调用 images API 从 Word 文档中提取图像。
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
// write the name of image extracted from word document
Console.WriteLine($"Image found at: {image.Path}");
}
// 有关更多信息,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
// 指定输入 Word 文档信息
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// 创建 ImagesRequest 对象
var request = new ImagesRequest(options);
// 调用 API 从 Word 文档中提取图像
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image found at: {image.Path}");
}
使用 cURL 下载 Word 文档图片
如果您偏好不带代码片段的图像提取,则可以尝试使用命令行终端或批处理文件通过 cURL 命令调用 GroupDocs.Parser Cloud。
步骤 1 – 生成 JWTAccess 令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步骤 2 – 提取图像:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 将 替换为您生成的那个。
- 如果您更喜欢提取所有页面的图像,则可以跳过
StartPageNumber和CountPagesToExtract参数。
免费的 Word 文档图片提取器
如果您还没有设置好环境,并且想要测试 GroupDocs.Parser Cloud API 的功能,那么您可以考虑尝试我们的免费 online Word Image Extractor 应用。

总结
GroupDocs.Parser Cloud SDK for .NET 是一个可靠的解决方案,用于内容提取、文档解析和自动化工作流程,涉及 Word、PDF、Excel 和其他格式。今天就尝试使用我们的 REST API 吧!
进一步阅读
常见问题 – FAQs
我可以从Word文档的特定页面提取图片吗?
- 是的。您可以定义
StartPageNumber和CountPagesToExtract参数。
API 是否保存图像分辨率?
- 是的。API 返回的嵌入图像与它们在 Word 文档中嵌入时的质量和分辨率相似。
进行此操作是否需要 Microsoft Word?
- 不。这是一个基于云的解决方案,独立于 MS Office 工作。
是否有免费试用?
- 是的。您可以通过试用帐户每月获得 150 次免费 API 调用。有关更多信息,请访问 pricing guide。
