有時,PowerPoint 簡報 (PPTX,PPT) 包含重要的文字資訊,例如標題、項目符號和描述,您可能需要分析或重用這些資訊。本文將演示如何使用 .NET REST API 程式性地從 PowerPoint 幻燈片(PPT 或 PPTX)中提取文字。
- 為什麼要從 PowerPoint 中提取文本?
- PowerPoint 文字提取 API
- 從 PPTX 中提取文本的 C# .NET 程式碼
- 使用 cURL 提取 PowerPoint 文字
- 試試在線 PowerPoint 文字提取工具
為什麼要從 PowerPoint 中提取文字?
從 PowerPoint 幻燈片中提取文本是有用的,當你想要:
- Retrieve content or notes from presentation slides for documentation.
- 在知識系統中索引和搜尋幻燈片內容。
- 進行內容分析或文本挖掘。
- 自動化批量提取 PowerPoint 文本以用於存檔或報告。
透過使用 GroupDocs.Parser Cloud,您可以輕鬆地從 PowerPoint 簡報中安全地提取文本內容,而無需在他們的系統上安裝 PowerPoint。
PowerPoint 文本提取 API
GroupDocs.Parser Cloud SDK for .NET 是一個強大的 REST API,旨在從多種文檔格式中提取文本、元數據和結構化數據,包括 PowerPoint, Word、Excel 和 PDF。
先決條件
在您開始之前,請確保您已經:
- A GroupDocs Cloud account 要獲取您的客戶 ID 和客戶密鑰。
- 在您的系統上安裝 .NET 6.0 或更高版本。
- Visual Studio 或其他兼容的 IDE。
安裝 SDK
通過 NuGet 安裝包:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
從 PPTX 中提取文本的 C# .NET 代碼
按照這些步驟以程式方式從 PowerPoint 簡報中提取文本。
步驟 1 – 初始化 API
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
步驟 2 – 設定檔案資訊
var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);
步驟 3 – 從幻燈片中提取文本
var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// 加載輸入的 PowerPoint 文件
using (var fileStream = OpenRead("input.pptx"))
{
// 上傳輸入的 PPT 到雲端儲存。
var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.pptx" }
};
var request = new TextRequest(options);
// 從 PowerPoint 簡報中提取文本
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
💡 您可以通過在
ParseOptions參數中定義幻燈片號碼來修改請求,以僅從選定的幻燈片中提取文本。
使用 cURL 提取 PowerPoint 文本
如果您更喜歡使用直接的 REST API 調用,請使用以下 cURL 命令從 PowerPoint 文件中提取文本,而無需編寫代碼。
第 1 步 – 獲取訪問令牌
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
步驟 2 – 從 PowerPoint 中提取文本
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"
將
{ACCESSTOKEN}替換為上面獲得的令牌, 並在FilePath下指定您的 PowerPoint 檔案名稱。
嘗試在線 PowerPoint 文本提取器
您還可以使用我們的免費 Online PowerPoint Text Extractor 來測試 API 功能,而無需編寫代碼。上傳您的 PowerPoint 文件,並立即下載以純文本格式提取的文本內容。

使用 GroupDocs.Parser Cloud 從 PowerPoint 在線提取文本。
結論
在本教程中,您學會了如何使用 GroupDocs.Parser Cloud SDK for .NET 從 PowerPoint 演示文稿中提取文本。這種方法使開發人員能夠自動化 PowerPoint 文本提取,非常適合用於構建內容分析、索引或搜索解決方案。
主要優勢:
- 輕鬆從 PPT 和 PPTX 幻燈片中提取文本。
- 不需要安裝 PowerPoint。
- 完全基於雲端,具備 REST API 整合。
- 導出乾淨、結構化的文本數據以進行進一步處理。
常見問題 – FAQs
我可以從 PPT 和 PPTX 文件中提取文本嗎? 是的。該 API 支援傳統 PPT 和現代 PPTX 格式。
我需要安裝 Microsoft PowerPoint 嗎? 不。GroupDocs.Parser Cloud 獨立於桌面軟體運作。
我可以只從特定的幻燈片中提取文本嗎? 是的。您可以在請求選項中定義幻燈片編號或範圍。
提取文本的格式是什麼? 文本以純文本 (.txt) 格式返回,適合分析或索引。
是否有可供測試的免費版本? 是的。您可以創建一個 free trial account,每月最多進行 150 次 API 調用。
