
如果您需要从 Microsoft PowerPoint 演示文稿中提取文本以用于自动化、归档或搜索索引,GroupDocs.Parser Cloud SDK for Node.js 提供了一种基于云的解决方案,快速、灵活且易于集成。只需几行代码,您就可以从 .ppt 和 .pptx 文件中提取纯文本或结构化文本,而无需依赖 Microsoft Office。
PowerPoint 文本提取 API
The GroupDocs.Parser Cloud SDK for Node.js 是一个高层次的 SDK,建立在一个强大的 REST API 之上,允许你提取:
- 幻灯片文本(每个幻灯片或整个演示文稿)。
- 从表格中结构化内容。
- 元数据。
- 嵌入的文件或图像。
它支持多种格式,包括 PDF、Word、Excel、PowerPoint、MSG、ZIP等。
前提条件
- 在 GroupDocs.Cloud Dashboard 注册。
- 获取您的客户端 ID 和客户端密钥。
- 安装 SDK:
npm install groupdocs-parser-cloud
Visit the following link to learn more about, 如何获取您的客户端 ID 和客户端密钥以进行身份验证.
如何使用 Node.js 从 PowerPoint 中提取文本
本节提供了如何使用 Node.js SDK 程序matically 从 PowerPoint 演示文稿中提取文本的详细信息。
步骤 1:初始化配置:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
步骤 2:设置文件信息和选项: 初始化 TextRequest 类的对象,并传递 TextOptions 类的实例。
const fileInfo = new FileInfo();
// path to PowerPoint presentation
fileInfo.filePath = "input.pptx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
步骤 3: 从 PowerPoint 中提取文本: 调用 text 方法,它将返回 PowerPoint 演示文稿中的纯文本。
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// 对于更多示例,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// 输入 PowerPoint 路径
fileInfo.filePath = "input.pptx";
// 指定 TextOptions 对象
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
您可以在下面的图片中查看上述代码示例的输出:

通过 cURL 提取 PowerPoint 文本
如果您更喜欢命令行操作或想要集成到脚本中?您可以使用 cURL 和 GroupDocs.Parser REST API 从 Word 文档中提取文本。
步骤 1 – 生成访问令牌:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步骤 2 – 通过 API 调用提取文本:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"input.pptx\",
\"StorageName\": \"internal\"
}
}"
- 将 替换为您生成的令牌。
使用 cURL 和 GroupDocs.Parser API 的好处
- ✅ 无需安装 SDK。
- ✅ 适合 bash 脚本或 cron 作业。
- ✅ 在 Linux、macOS 和 Windows 环境中均有效。
- ✅ 轻巧而快速。
免费 PowerPoint 文本提取器
使用我们的 Free Online PowerPoint Text Extractor,由 GroupDocs.Parser Cloud 提供支持,如果您更喜欢无代码选项。

结论
使用 GroupDocs.Parser Cloud SDK for Node.js,您可以通过最少的代码高效地从 PowerPoint 演示文稿中提取文本。该 SDK 和 REST API 支持现代开发工作流程 - 无论您是更喜欢编程 SDK 还是轻量级的 cURL 脚本。
📚 其他资源
常见问题 – FAQs
- 我可以从带格式的幻灯片中提取文本吗?
- 是的。API 返回的结构化文本包括幻灯片顺序。
- 提取内容需要 PowerPoint 吗?
- 不。该 API 运行在云端,不依赖于 Microsoft Office。
- 定价模型是什么?
- 我们提供一种按需支付的定价模型。有关更多信息,请访问 定价指南。
- 是否有免费试用?
- 是的。您可以使用免费试用帐户每月进行最多 150 次 API 调用。有关更多详细信息,请访问 pricing guide.