从Word文档中提取PowerPoint图像 - 图像提取器

如果您需要提取 Word 文档中的嵌入图像以进行归档、自动化或图像识别,您的 Node.js REST API 提供了一种强大且基于云的解决方案,可以从 .doc.docx 文件中提取图像,而无需安装 Microsoft Word。

图像提取的需求也可能发生,如果我们需要:

  • 捕捉嵌入报告中的图形、图表和照片。
  • 自动化从扫描文档或模板中提取数据。
  • 从文档库构建图像数据集。
  • 预处理内容以用于OCR或AI任务。

让我们更详细地探讨以下主题:

Word Document Image Extraction API

GroupDocs.Parser Cloud SDK for Node.js 是一个基于 REST 的解决方案,提供解析 MS Word 文档以进行内容操作的功能。不仅支持 Word 文档,还支持从几乎所有常见的商业文档格式中提取内容,包括 (PPTX, Excel, PDF, ZIP, 等)。

先决条件

npm install groupdocs-parser-cloud
  • 要获取有关客户端凭据的更多信息,请访问此 article

如何使用 Node.js 从 Word 中提取图像

按照以下步骤使用 Node.js API 开发一个简单且可靠的应用程序,以从 MS Word 文档中提取图像:

步骤 1:初始化配置。

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

步骤 2:设置文件信息和图像选项。 初始化 ImagesRequest 类的对象,并传递 ImagesOptions 类的实例。

const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

步骤 3:从 Word 文档中提取图像。 调用 images 方法从在线 Word 文档中提取图像。

parserApi.images(request).then((response) => {
    console.log("The Word document Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// 要查看更多示例,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.images(request).then((response) => {
  console.log("The Word document Images extracted successfully.");
  console.log(response.images);
}).catch(err => {
    console.error("Failed to extract images:", err);
});

您可以在下方的图像中看到上述代码示例的输出:

使用 Node.js API 从 Word 文档提取图像的预览

通过 cURL 从 Word 中提取图像

如果您更喜欢使用命令行方式通过 cURL 命令提取 Word 文档中的图像,那么 GroupDocs.Parser Cloud 支持这些功能。让我们进一步探讨此功能,以简化如何使用 cURL 命令从 Word 文档中获取图像的需求。

步骤 1 – 生成访问令牌:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步骤 2 - 从 Word 文件中提取图像:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • 🔐 用你生成的 替换。
  • 如果您需要从整个文档中提取图像,只需忽略参数 StartPageNumber & CountPagesToExtract

尝试免费单词图像提取器在线

如果您更喜欢基于 UI 的方法来提取 Word 文档中的图像,那么您可以考虑使用我们的免费在线 Word Document Image Extractor,由 GroupDocs.Parser Cloud 提供支持。

免费图片提取器

结论

使用 GroupDocs.Parser Cloud SDK for Node.js,从 Word 文件中提取图像变得快速且可扩展。无论您需要处理合同、报告还是扫描表单 — 这个 API 让您完全控制 Word 文档的图像提取。

📚 额外资源

常见问题 – FAQs

Can I extract images from specific pages in a Word document?

  • 是的。您可以定义 StartPageNumberCountPagesToExtract 参数。

提取的图像是否以原始格式和分辨率提取?

  • 是的。API 返回的嵌入图像与文档中的内容相同。

我需要安装 Microsoft Word 吗?

  • 不。这是一个基于云的解决方案,与 MS Office 独立工作。

是否有免费试用?

  • 是的。您可以使用试用帐户每月获取 150 次免费的 API 调用。欲了解更多信息,请访问 pricing guide.

相关文章