使用 Node.js API 从 PowerPoint 演示文稿中提取文本 - PowerPoint 文本提取器

如果您需要从 Microsoft PowerPoint 演示文稿中提取文本以用于自动化、归档或搜索索引,GroupDocs.Parser Cloud SDK for Node.js 提供了一种基于云的解决方案,快速、灵活且易于集成。只需几行代码,您就可以从 .ppt.pptx 文件中提取纯文本或结构化文本,而无需依赖 Microsoft Office。

PowerPoint 文本提取 API

The GroupDocs.Parser Cloud SDK for Node.js 是一个高层次的 SDK,建立在一个强大的 REST API 之上,允许你提取:

  • 幻灯片文本(每个幻灯片或整个演示文稿)。
  • 从表格中结构化内容。
  • 元数据。
  • 嵌入的文件或图像。

它支持多种格式,包括 PDFWordExcelPowerPointMSGZIP等。

前提条件

  1. GroupDocs.Cloud Dashboard 注册。
  2. 获取您的客户端 ID 和客户端密钥。
  3. 安装 SDK:
npm install groupdocs-parser-cloud

Visit the following link to learn more about, 如何获取您的客户端 ID 和客户端密钥以进行身份验证.

如何使用 Node.js 从 PowerPoint 中提取文本

本节提供了如何使用 Node.js SDK 程序matically 从 PowerPoint 演示文稿中提取文本的详细信息。

步骤 1:初始化配置:

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

步骤 2:设置文件信息和选项: 初始化 TextRequest 类的对象,并传递 TextOptions 类的实例。

const fileInfo = new FileInfo();
// path to PowerPoint presentation
fileInfo.filePath = "input.pptx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

步骤 3: 从 PowerPoint 中提取文本: 调用 text 方法,它将返回 PowerPoint 演示文稿中的纯文本。

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});
// 对于更多示例,请访问 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// 输入 PowerPoint 路径
fileInfo.filePath = "input.pptx";

// 指定 TextOptions 对象
const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});

您可以在下面的图片中查看上述代码示例的输出:

提取 PowerPoint 演示文稿文本

通过 cURL 提取 PowerPoint 文本

如果您更喜欢命令行操作或想要集成到脚本中?您可以使用 cURL 和 GroupDocs.Parser REST API 从 Word 文档中提取文本。

步骤 1 – 生成访问令牌:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步骤 2 – 通过 API 调用提取文本:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d 
    "{  
        \"FileInfo\": 
        {
            \"FilePath\": \"input.pptx\",
            \"StorageName\": \"internal\"
        }
    }"
  • 将 替换为您生成的令牌。

使用 cURL 和 GroupDocs.Parser API 的好处

  • ✅ 无需安装 SDK。
  • ✅ 适合 bash 脚本或 cron 作业。
  • ✅ 在 Linux、macOS 和 Windows 环境中均有效。
  • ✅ 轻巧而快速。

免费 PowerPoint 文本提取器

使用我们的 Free Online PowerPoint Text Extractor,由 GroupDocs.Parser Cloud 提供支持,如果您更喜欢无代码选项。

在线 PowerPoint 文本提取器

结论

使用 GroupDocs.Parser Cloud SDK for Node.js,您可以通过最少的代码高效地从 PowerPoint 演示文稿中提取文本。该 SDK 和 REST API 支持现代开发工作流程 - 无论您是更喜欢编程 SDK 还是轻量级的 cURL 脚本。

📚 其他资源

常见问题 – FAQs

  1. 我可以从带格式的幻灯片中提取文本吗?
  • 是的。API 返回的结构化文本包括幻灯片顺序。
  1. 提取内容需要 PowerPoint 吗?
  • 不。该 API 运行在云端,不依赖于 Microsoft Office。
  1. 定价模型是什么?
  • 我们提供一种按需支付的定价模型。有关更多信息,请访问 定价指南
  1. 是否有免费试用?
  • 是的。您可以使用免费试用帐户每月进行最多 150 次 API 调用。有关更多详细信息,请访问 pricing guide.

推荐的文章