Word 文档通常包含丰富的视觉元素,如徽标、图表和产品图片,您可能需要单独重用或分析这些元素。手动从 .doc 或 .docx 文件中保存每个图像可能会很慢且容易出错——尤其是在处理大量文档或自动化工作流程时。
因此,在本文中,我们将学习如何通过简单的API调用以编程方式从Word文档中提取图像的详细信息。我们的基于REST的SDK完全在云端工作——无需Microsoft Word或外部库——使其非常适合自动化、集成和可扩展的应用程序。
图像提取的显著特征
- 将文档视觉效果归档到集中式媒体库中
- 处理机器学习或OCR工作流中的嵌入图形
- 从报告和合同中重新利用公司资产
- 在文档系统之间迁移视觉数据
让我们更详细地探讨以下主题:
Word 文档处理 API
The GroupDocs.Parser Cloud SDK for .NET 是我们获奖的基于 REST 的 API,提供处理各种文件格式的能力,包括 Word 文档、 PPTX、 Excel、 PDF、 ZIP 等。根据我们的要求,API 通过让您在 C# 应用程序中直接从 .doc
和 .docx
文件中读取、提取和保存图片来简化这些用例。
先决条件
- 在 GroupDocs Cloud Dashboard 注册。
- 获取您的客户端ID和客户端密钥。有关更多详细信息,请访问这 article。
- 安装基于 REST 的 SDK:
- 安装 .NET 6.0 或更高版本以及 Visual Studio。
从 NuGet 包中安装 SDK:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
- 有关客户端凭据的更多信息,
如何在 C# 中从 Word 中提取图像
按照下面简单的三步流程使用 C# 和 GroupDocs.Parser Cloud REST API 从 Word 文档中提取图像。
步骤 1:初始化 API 配置
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
步骤 2:设置文件路径和提取选项 初始化一个 ImagesRequest 对象,并将 ImagesOptions 类的实例作为参数传递。
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
步骤 3:检索文档图像。 调用 images API 从 Word 文档中提取图像。
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
// write the name of image extracted from word document
Console.WriteLine($"Image found at: {image.Path}");
}
// 有关更多信息,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
// 指定输入 Word 文档信息
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// 创建 ImagesRequest 对象
var request = new ImagesRequest(options);
// 调用 API 从 Word 文档中提取图像
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image found at: {image.Path}");
}
使用 cURL 下载 Word 文档图片
如果您偏好不带代码片段的图像提取,则可以尝试使用命令行终端或批处理文件通过 cURL 命令调用 GroupDocs.Parser Cloud。
步骤 1 – 生成 JWTAccess 令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步骤 2 – 提取图像:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 将 替换为您生成的那个。
- 如果您更喜欢提取所有页面的图像,则可以跳过
StartPageNumber
和CountPagesToExtract
参数。
免费的 Word 文档图片提取器
如果您还没有设置好环境,并且想要测试 GroupDocs.Parser Cloud API 的功能,那么您可以考虑尝试我们的免费 online Word Image Extractor 应用。

总结
GroupDocs.Parser Cloud SDK for .NET 是一个可靠的解决方案,用于内容提取、文档解析和自动化工作流程,涉及 Word、PDF、Excel 和其他格式。今天就尝试使用我们的 REST API 吧!
进一步阅读
常见问题 – FAQs
我可以从Word文档的特定页面提取图片吗?
- 是的。您可以定义
StartPageNumber
和CountPagesToExtract
参数。
API 是否保存图像分辨率?
- 是的。API 返回的嵌入图像与它们在 Word 文档中嵌入时的质量和分辨率相似。
进行此操作是否需要 Microsoft Word?
- 不。这是一个基于云的解决方案,独立于 MS Office 工作。
是否有免费试用?
- 是的。您可以通过试用帐户每月获得 150 次免费 API 调用。有关更多信息,请访问 pricing guide。