有時,PowerPoint 簡報 (PPTXPPT) 包含重要的文字資訊,例如標題、項目符號和描述,您可能需要分析或重用這些資訊。本文將演示如何使用 .NET REST API 程式性地從 PowerPoint 幻燈片(PPT 或 PPTX)中提取文字。

為什麼要從 PowerPoint 中提取文字?

從 PowerPoint 幻燈片中提取文本是有用的,當你想要:

  • Retrieve content or notes from presentation slides for documentation.
  • 在知識系統中索引和搜尋幻燈片內容。
  • 進行內容分析或文本挖掘。
  • 自動化批量提取 PowerPoint 文本以用於存檔或報告。

透過使用 GroupDocs.Parser Cloud,您可以輕鬆地從 PowerPoint 簡報中安全地提取文本內容,而無需在他們的系統上安裝 PowerPoint。

PowerPoint 文本提取 API

GroupDocs.Parser Cloud SDK for .NET 是一個強大的 REST API,旨在從多種文檔格式中提取文本、元數據和結構化數據,包括 PowerPoint, Word、Excel 和 PDF。

先決條件

在您開始之前,請確保您已經:

  • A GroupDocs Cloud account 要獲取您的客戶 ID 和客戶密鑰。
  • 在您的系統上安裝 .NET 6.0 或更高版本。
  • Visual Studio 或其他兼容的 IDE。

安裝 SDK

通過 NuGet 安裝包:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

從 PPTX 中提取文本的 C# .NET 代碼

按照這些步驟以程式方式從 PowerPoint 簡報中提取文本。

步驟 1 – 初始化 API

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

步驟 2 – 設定檔案資訊

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

步驟 3 – 從幻燈片中提取文本

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// 加載輸入的 PowerPoint 文件
using (var fileStream = OpenRead("input.pptx"))
{
    // 上傳輸入的 PPT 到雲端儲存。
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// 從 PowerPoint 簡報中提取文本
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 您可以通過在 ParseOptions 參數中定義幻燈片號碼來修改請求,以僅從選定的幻燈片中提取文本。

使用 cURL 提取 PowerPoint 文本

如果您更喜歡使用直接的 REST API 調用,請使用以下 cURL 命令從 PowerPoint 文件中提取文本,而無需編寫代碼。

第 1 步 – 獲取訪問令牌

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

步驟 2 – 從 PowerPoint 中提取文本

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

{ACCESSTOKEN} 替換為上面獲得的令牌, 並在 FilePath 下指定您的 PowerPoint 檔案名稱。

嘗試在線 PowerPoint 文本提取器

您還可以使用我們的免費 Online PowerPoint Text Extractor 來測試 API 功能,而無需編寫代碼。上傳您的 PowerPoint 文件,並立即下載以純文本格式提取的文本內容。

從 PowerPoint 在線提取文本

使用 GroupDocs.Parser Cloud 從 PowerPoint 在線提取文本。

結論

在本教程中,您學會了如何使用 GroupDocs.Parser Cloud SDK for .NET 從 PowerPoint 演示文稿中提取文本。這種方法使開發人員能夠自動化 PowerPoint 文本提取,非常適合用於構建內容分析、索引或搜索解決方案。

主要優勢:

  • 輕鬆從 PPT 和 PPTX 幻燈片中提取文本。
  • 不需要安裝 PowerPoint。
  • 完全基於雲端,具備 REST API 整合。
  • 導出乾淨、結構化的文本數據以進行進一步處理。

常見問題 – FAQs

  1. 我可以從 PPT 和 PPTX 文件中提取文本嗎? 是的。該 API 支援傳統 PPT 和現代 PPTX 格式。

  2. 我需要安裝 Microsoft PowerPoint 嗎? 不。GroupDocs.Parser Cloud 獨立於桌面軟體運作。

  3. 我可以只從特定的幻燈片中提取文本嗎? 是的。您可以在請求選項中定義幻燈片編號或範圍。

  4. 提取文本的格式是什麼? 文本以純文本 (.txt) 格式返回,適合分析或索引。

  5. 是否有可供測試的免費版本? 是的。您可以創建一個 free trial account,每月最多進行 150 次 API 調用。

有用的連結

相關文章