時には、PowerPointプレゼンテーション(PPTXPPT)には、分析または再利用が必要なタイトル、箇条書き、説明などの重要なテキスト情報が含まれています。テキストを手動でコピーするのではなく、この記事では、.NET REST APIを使用してプログラム的にPowerPointスライド(PPTまたはPPTX)からテキストを抽出する方法を示します。

PowerPointからテキストを抽出する理由は何ですか?

PowerPointスライドからテキストを抽出することは、次のような場合に便利です。

  • Retrieve content or notes from presentation slides for documentation.
  • ナレッジシステム内のスライドコンテンツをインデックス化し、検索します。
  • コンテンツ分析またはテキストマイニングを実施します。
  • バルクPowerPointテキスト抽出を自動化して、アーカイブまたは報告に利用します。

GroupDocs.Parser Cloud を使用することで、システムに PowerPoint を必要とせずに、クラウド上で PowerPoint プレゼンテーションから安全にテキストコンテンツを簡単に抽出できます。

PowerPoint テキスト抽出 API

GroupDocs.Parser Cloud SDK for .NET は、PowerPoint, Word、Excel、PDFなど、複数の文書形式からテキスト、メタデータ、構造化データを抽出するように設計された強力なREST APIです。

前提条件

始める前に、次のことを確認してください:

  • A GroupDocs Cloud account クライアントIDとクライアントシークレットを取得するために。
  • .NET 6.0 以上がシステムにインストールされていること。
  • Visual Studio または別の互換性のある IDE。

SDKをインストールします。

NuGetを介してパッケージをインストールします:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

C# .NET で PPTX からテキストを抽出する

プログラムmaticallyでPowerPointプレゼンテーションからテキストを抽出するための手順に従ってください。

ステップ 1 – APIを初期化する

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

ステップ 2 – ファイル情報を設定する

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

ステップ3 – スライドからテキストを抽出する

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
    // upload the input PPT to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// PowerPointプレゼンテーションからテキストを抽出する
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 スライド番号を ParseOptions パラメータで定義することで、選択したスライドからテキストのみを抽出するリクエストを変更できます。

cURLを使用してPowerPointテキストを抽出する

直接REST APIコールを使用したい場合は、以下のcURLコマンドを使用して、コードを書くことなくPowerPointファイルからテキストを抽出します。

ステップ 1 – アクセストークンを取得する

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

ステップ2 - PowerPointからテキストを抽出する

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

{ACCESSTOKEN} を上記で取得したトークンに置き換えてください。 お使いの PowerPoint ファイル名を FilePath の下に指定してください。

オンライン PowerPoint テキスト抽出ツールを試してみてください。

あなたはまた、コードを書くことなくAPIの機能をテストするために無料の Online PowerPoint Text Extractor を使用することができます。PowerPointファイルをアップロードし、抽出されたテキストコンテンツをプレーンテキスト形式で瞬時にダウンロードしてください。

extract text from powerpoint online

PowerPointオンラインからテキストを抽出するには、GroupDocs.Parser Cloudを使用します。

結論

このチュートリアルでは、GroupDocs.Parser Cloud SDK for .NETを使用してPowerPointプレゼンテーションからテキストを抽出する方法を学びました。このアプローチにより、開発者はPowerPointのテキスト抽出を自動化できるため、コンテンツ分析、インデックス作成、または検索ソリューションを構築するのに最適です。

主な利点:

  • PPTおよびPPTXスライドからテキストを effortlessly 抽出します。
  • PowerPointのインストールは必要ありません。
  • 完全にクラウドベースで、REST API統合があります。
  • クリーンで構造化されたテキストデータをエクスポートして、さらなる処理を行います。

よくある質問 – FAQs

  1. PPTおよびPPTXファイルからテキストを抽出できますか? はい。APIは、従来のPPT形式と現代のPPTX形式の両方をサポートしています。

  2. Microsoft PowerPointをインストールする必要がありますか? いいえ。GroupDocs.Parser Cloudはデスクトップソフトウェアとは独立して機能します。

  3. 特定のスライドからのみテキストを抽出できますか? はい。リクエストオプションでスライド番号または範囲を定義できます。

  4. 抽出されたテキストのフォーマットは何ですか? テキストは分析やインデックス作成に適したプレーンテキスト (.txt) 出力として返されます。

  5. テスト用の無料版はありますか? はい。あなたは free trial account を作成し、月に最大150回のAPI呼び出しを行うことができます。

役立つリンク

関連する記事