
如果您需要提取 Word 文档中的嵌入图像以进行归档、自动化或图像识别,您的 Node.js REST API 提供了一种强大且基于云的解决方案,可以从 .doc 和 .docx 文件中提取图像,而无需安装 Microsoft Word。
图像提取的需求也可能发生,如果我们需要:
- 捕捉嵌入报告中的图形、图表和照片。
- 自动化从扫描文档或模板中提取数据。
- 从文档库构建图像数据集。
- 预处理内容以用于OCR或AI任务。
让我们更详细地探讨以下主题:
Word Document Image Extraction API
GroupDocs.Parser Cloud SDK for Node.js 是一个基于 REST 的解决方案,提供解析 MS Word 文档以进行内容操作的功能。不仅支持 Word 文档,还支持从几乎所有常见的商业文档格式中提取内容,包括 (PPTX, Excel, PDF, ZIP, 等)。
先决条件
- 在 GroupDocs Cloud Dashboard 注册。
- 获取您的客户端 ID 和客户端密钥。
- 安装基于REST的SDK:
npm install groupdocs-parser-cloud
- 要获取有关客户端凭据的更多信息,请访问此 article。
如何使用 Node.js 从 Word 中提取图像
按照以下步骤使用 Node.js API 开发一个简单且可靠的应用程序,以从 MS Word 文档中提取图像:
步骤 1:初始化配置。
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
步骤 2:设置文件信息和图像选项。 初始化 ImagesRequest 类的对象,并传递 ImagesOptions 类的实例。
const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
步骤 3:从 Word 文档中提取图像。 调用 images 方法从在线 Word 文档中提取图像。
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// 要查看更多示例,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch(err => {
console.error("Failed to extract images:", err);
});
您可以在下方的图像中看到上述代码示例的输出:

通过 cURL 从 Word 中提取图像
如果您更喜欢使用命令行方式通过 cURL 命令提取 Word 文档中的图像,那么 GroupDocs.Parser Cloud 支持这些功能。让我们进一步探讨此功能,以简化如何使用 cURL 命令从 Word 文档中获取图像的需求。
步骤 1 – 生成访问令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步骤 2 - 从 Word 文件中提取图像:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 🔐 用你生成的 替换。
- 如果您需要从整个文档中提取图像,只需忽略参数
StartPageNumber
&CountPagesToExtract
。
尝试免费单词图像提取器在线
如果您更喜欢基于 UI 的方法来提取 Word 文档中的图像,那么您可以考虑使用我们的免费在线 Word Document Image Extractor,由 GroupDocs.Parser Cloud 提供支持。

结论
使用 GroupDocs.Parser Cloud SDK for Node.js,从 Word 文件中提取图像变得快速且可扩展。无论您需要处理合同、报告还是扫描表单 — 这个 API 让您完全控制 Word 文档的图像提取。
📚 额外资源
常见问题 – FAQs
Can I extract images from specific pages in a Word document?
- 是的。您可以定义
StartPageNumber
和CountPagesToExtract
参数。
提取的图像是否以原始格式和分辨率提取?
- 是的。API 返回的嵌入图像与文档中的内容相同。
我需要安装 Microsoft Word 吗?
- 不。这是一个基于云的解决方案,与 MS Office 独立工作。
是否有免费试用?
- 是的。您可以使用试用帐户每月获取 150 次免费的 API 调用。欲了解更多信息,请访问 pricing guide.