Node.js で Word ドキュメントの画像を抽出する

埋め込まれた画像をアーカイブ、オートメーション、または画像認識のために Word 文書から抽出する必要がありますか？その場合、私たちの Node.js REST API は、Microsoft Word をインストールすることなく .doc と .docx ファイルから画像を抽出するための堅牢でクラウドベースのソリューションを提供します。

画像抽出の必要性は、次の場合にも発生する可能性があります:

レポートに埋め込まれたグラフィックス、チャート、写真をキャプチャします。
スキャンした文書やテンプレートからの抽出を自動化します。
ドキュメントリポジトリから画像データセットを構築します。
OCRやAIタスクのためのコンテンツを前処理します。

以下のトピックについて、より詳細に探求しましょう：

Word Document Image Extraction API
Wordから画像をNode.jsを使って抽出する方法
WordからcURLを使って画像を抽出する
無料のワード画像抽出ツールをオンラインで試す

Word Document Image Extraction API

The GroupDocs.Parser Cloud SDK for Node.js は、コンテンツ操作のために MS Word 文書を解析する機能を提供する REST ベースのソリューションです。Word 文書だけでなく、ほぼすべての一般的なビジネス文書フォーマットからのコンテンツ抽出のサポートも提供しています (PPTX, Excel, PDF, ZIP など)。

前提条件

GroupDocs Cloud Dashboard にサインアップしてください。
クライアントIDとクライアントシークレットを取得してください。
RESTベースのSDKをインストールします:

npm install groupdocs-parser-cloud

クライアント資格情報に関する詳細は、こちらの article をご覧ください。

Wordから画像をNode.jsを使用して抽出する方法

これらの手順に従って、Node.js APIを使用してMS Word文書から画像を抽出する簡単で堅牢なアプリケーションを開発してください:

ステップ 1: 設定を初期化します。

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

ステップ 2: ファイル情報と画像オプションの設定。 ImagesRequest クラスのオブジェクトを初期化し、ImagesOptions クラスのインスタンスを渡します。

const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

ステップ 3: Word 文書から画像を抽出します。ワード文書からオンラインで画像を抽出するには、images メソッドを呼び出します。

parserApi.images(request).then((response) => {
    console.log("The Word document Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

// 例をもっと見るには、 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node を訪れてください。
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.images(request).then((response) => {
  console.log("The Word document Images extracted successfully.");
  console.log(response.images);
}).catch(err => {
    console.error("Failed to extract images:", err);
});

上記のコードサンプルの出力は、以下の画像に表示されています:

WordからcURLを使って画像を抽出する

Word文書の画像をcURLコマンドを使用して抽出するためのコマンドラインアプローチを好む場合は、 GroupDocs.Parser Cloud がこれらの機能をサポートしています。この機能をさらに探求し、cURLコマンドを使用してWord文書から画像を取得する方法の要件を簡素化しましょう。

ステップ 1 – アクセストークンを生成する:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

ステップ 2 – Word ファイルから画像を抽出する:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"

🔐 をあなたが生成したものに置き換えてください。
画像を文書全体から抽出する必要がある場合は、単にパラメーター StartPageNumber と CountPagesToExtract を無視してください。

無料のワード画像抽出機をオンラインで試す

もし、Word文書の画像を抽出するためにUIベースのアプローチを好むのであれば、GroupDocs.Parser Cloudによって駆動される無料のオンラインWord Document Image Extractorの使用を検討してください。

結論

GroupDocs.Parser Cloud SDK for Node.jsを使用することで、Wordファイルから画像を迅速かつスケーラブルに抽出できます。契約書、レポート、スキャンしたフォームの処理が必要な場合でも、このAPIはWord文書の画像抽出を完全に制御します。

📚 追加リソース

Parser API Documentation
API リファレンス
GitHub SDK (Node.js)
サポートフォーラム

よくある質問 – FAQs

特定のページから Word ドキュメントの画像を抽出することはできますか？

はい。StartPageNumber と CountPagesToExtract パラメーターを定義できます。

画像は元の形式と解像度で抽出されていますか？

はい。APIはドキュメント内の画像をそのまま返します。

Microsoft Wordはインストールする必要がありますか？

いいえ。これはクラウドベースのソリューションで、MS Officeに依存せずに動作します。

無料トライアルはありますか？

はい。トライアルアカウントを使用すると、1か月あたり150回の無料APIコールを取得できます。詳細については、pricing guideをご覧ください。

Node.js で Word から画像を抽出する | Word ドキュメント画像抽出ツール

Word Document Image Extraction API

Wordから画像をNode.jsを使用して抽出する方法

WordからcURLを使って画像を抽出する

無料のワード画像抽出機をオンラインで試す

結論

📚 追加リソース

よくある質問 – FAQs

関連する記事

Word Document Image Extraction API#

Wordから画像をNode.jsを使用して抽出する方法#

WordからcURLを使って画像を抽出する#

無料のワード画像抽出機をオンラインで試す#

結論#

📚 追加リソース#

よくある質問 – FAQs#

関連する記事#

Word Document Image Extraction API

Wordから画像をNode.jsを使用して抽出する方法

WordからcURLを使って画像を抽出する

無料のワード画像抽出機をオンラインで試す

結論

📚 追加リソース

よくある質問 – FAQs

関連する記事