Word 文書には、再利用や別個に分析する必要があるロゴ、チャート、製品画像などのリッチビジュアル要素が含まれていることがよくあります。.doc や .docx ファイルから各画像を手動で保存するのは、特に大量の文書や自動化されたワークフローを扱う際には、遅くエラーが発生しやすいです。
したがって、この記事では、いくつかの簡単なAPI呼び出しを使用して、Word文書から画像をプログラムで抽出する方法の詳細を学びます。私たちのRESTベースのSDKは完全にクラウドで動作し、Microsoft Wordや外部ライブラリを必要としないため、自動化、統合、およびスケーラブルなアプリケーションに最適です。
画像抽出の顕著な特徴
- 文書のビジュアルを中央集権的なメディアライブラリにアーカイブする
- 機械学習やOCRワークフローのための埋め込みグラフィックの処理
- レポートや契約からの会社資産の再利用
- ドキュメントシステム間でのビジュアルデータの移行
次のトピックをより詳しく探求しましょう:
Word Document Processing API
The GroupDocs.Parser Cloud SDK for .NET は、Word ドキュメント、 PPTX、 Excel、 PDF、 ZIP など、さまざまなファイル形式を操作する機能を備えた、受賞歴のある REST ベースの API です。私たちの要件に応じて、API はこれらのユースケースを簡素化し、C# アプリケーションの .doc
および .docx
ファイルから直接画像を読み取り、抽出し、保存できるようにします。
前提条件
- GroupDocs Cloud Dashboard にサインアップしてください。
- クライアントIDとクライアントシークレットを取得してください。詳細については、この article をご覧ください。
- RESTベースのSDKをインストールします:
- .NET 6.0 以降と Visual Studio をインストールしてください。
NuGet パッケージから SDK をインストールします:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
- クライアント認証情報の詳細については、
Wordから画像を抽出する方法 in C#
以下の簡単な3ステップのプロセスに従って、C#とGroupDocs.Parser Cloud REST APIを使用してWordドキュメントから画像を抽出します。
ステップ 1: API 設定を初期化する
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
ステップ 2: ファイルパスと抽出オプションを設定する ImagesRequest オブジェクトを初期化し、ImagesOptions クラスのインスタンスを引数として渡します。
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
var request = new ImagesRequest(options);
ステップ 3: ドキュメント画像を取得します。 ワード文書から画像を抽出するために images API を呼び出してください。
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
// write the name of image extracted from word document
Console.WriteLine($"Image found at: {image.Path}");
}
// 詳しい情報については、 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet をご覧ください。
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
// specify the input Word document information
var fileInfo = new FileInfo
{
FilePath = "sample.docx"
};
var options = new ImagesOptions
{
FileInfo = fileInfo
};
// ImagesRequest オブジェクトを作成します。
var request = new ImagesRequest(options);
// Word ドキュメントから画像を抽出するために API を呼び出します。
var response = parserApi.Images(request);
foreach (var image in response.Images)
{
Console.WriteLine($"Image found at: {image.Path}");
}
Word 文書の画像を cURL でダウンロードする
コードスニペットなしで画像抽出を希望する場合は、コマンドラインターミナルまたはバッチファイルから cURL コマンドを使用して GroupDocs.Parser Cloud を呼び出してみてください。
ステップ 1 – JWT アクセストークンを生成する:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
ステップ 2 – 画像を抽出する:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- を生成したものに置き換えてください。
- すべてのページから画像を抽出したい場合は、
StartPageNumber
とCountPagesToExtract
パラメーターをスキップしてください。
フリー ワード ドキュメント 画像 抽出ツール
環境が設定されていない場合や、GroupDocs.Parser Cloud APIの機能をテストしたい場合は、無料のオンライン Word Image Extractorアプリを試してみることをお勧めします。

要約
GroupDocs.Parser Cloud SDK for .NET は、Word、PDF、Excel およびその他の形式に関するコンテンツ抽出、文書解析、および自動化ワークフローに対する信頼性の高いソリューションです。ぜひ、今日私たちの REST API をお試しください!
さらなる読書
よくある質問 – FAQs
特定のページからWord文書の画像を抽出できますか?
- はい。
StartPageNumber
とCountPagesToExtract
パラメータを定義できます。
APIは画像の解像度を保持しますか?
- はい。APIは、Wordドキュメントに埋め込まれていたのと同様の品質と解像度で埋め込まれた画像を返します。
この操作を実行するには Microsoft Word が必要ですか?
- いいえ。これはクラウドベースのソリューションであり、MS Officeとは独立して機能します。
無料トライアルはありますか?
- はい。トライアルアカウントで月に150回の無料APIコールができます。詳細については、pricing guideをご覧ください。