
埋め込まれた画像をアーカイブ、オートメーション、または画像認識のために Word 文書から抽出する必要がありますか?その場合、私たちの Node.js REST API は、Microsoft Word をインストールすることなく .doc と .docx ファイルから画像を抽出するための堅牢でクラウドベースのソリューションを提供します。
画像抽出の必要性は、次の場合にも発生する可能性があります:
- レポートに埋め込まれたグラフィックス、チャート、写真をキャプチャします。
- スキャンした文書やテンプレートからの抽出を自動化します。
- ドキュメントリポジトリから画像データセットを構築します。
- OCRやAIタスクのためのコンテンツを前処理します。
以下のトピックについて、より詳細に探求しましょう:
- Word Document Image Extraction API
- Wordから画像をNode.jsを使って抽出する方法
- WordからcURLを使って画像を抽出する
- 無料のワード画像抽出ツールをオンラインで試す
Word Document Image Extraction API
The GroupDocs.Parser Cloud SDK for Node.js は、コンテンツ操作のために MS Word 文書を解析する機能を提供する REST ベースのソリューションです。Word 文書だけでなく、ほぼすべての一般的なビジネス文書フォーマットからのコンテンツ抽出のサポートも提供しています (PPTX, Excel, PDF, ZIP など)。
前提条件
- GroupDocs Cloud Dashboard にサインアップしてください。
- クライアントIDとクライアントシークレットを取得してください。
- RESTベースのSDKをインストールします:
npm install groupdocs-parser-cloud
- クライアント資格情報に関する詳細は、こちらの article をご覧ください。
Wordから画像をNode.jsを使用して抽出する方法
これらの手順に従って、Node.js APIを使用してMS Word文書から画像を抽出する簡単で堅牢なアプリケーションを開発してください:
ステップ 1: 設定を初期化します。
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
ステップ 2: ファイル情報と画像オプションの設定。 ImagesRequest クラスのオブジェクトを初期化し、ImagesOptions クラスのインスタンスを渡します。
const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
ステップ 3: Word 文書から画像を抽出します。 ワード文書からオンラインで画像を抽出するには、images メソッドを呼び出します。
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// 例をもっと見るには、 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node を訪れてください。
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch(err => {
console.error("Failed to extract images:", err);
});
上記のコードサンプルの出力は、以下の画像に表示されています:

WordからcURLを使って画像を抽出する
Word文書の画像をcURLコマンドを使用して抽出するためのコマンドラインアプローチを好む場合は、 GroupDocs.Parser Cloud がこれらの機能をサポートしています。この機能をさらに探求し、cURLコマンドを使用してWord文書から画像を取得する方法の要件を簡素化しましょう。
ステップ 1 – アクセストークンを生成する:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
ステップ 2 – Word ファイルから画像を抽出する:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 🔐 をあなたが生成したものに置き換えてください。
- 画像を文書全体から抽出する必要がある場合は、単にパラメーター
StartPageNumber
とCountPagesToExtract
を無視してください。
無料のワード画像抽出機をオンラインで試す
もし、Word文書の画像を抽出するためにUIベースのアプローチを好むのであれば、GroupDocs.Parser Cloudによって駆動される無料のオンラインWord Document Image Extractorの使用を検討してください。

結論
GroupDocs.Parser Cloud SDK for Node.jsを使用することで、Wordファイルから画像を迅速かつスケーラブルに抽出できます。契約書、レポート、スキャンしたフォームの処理が必要な場合でも、このAPIはWord文書の画像抽出を完全に制御します。
📚 追加リソース
よくある質問 – FAQs
特定のページから Word ドキュメントの画像を抽出することはできますか?
- はい。
StartPageNumber
とCountPagesToExtract
パラメーターを定義できます。
画像は元の形式と解像度で抽出されていますか?
- はい。APIはドキュメント内の画像をそのまま返します。
Microsoft Wordはインストールする必要がありますか?
- いいえ。これはクラウドベースのソリューションで、MS Officeに依存せずに動作します。
無料トライアルはありますか?
- はい。トライアルアカウントを使用すると、1か月あたり150回の無料APIコールを取得できます。詳細については、pricing guideをご覧ください。