Node.js で Word から画像を抽出する - 画像ファイル抽出ツール

DOCX/DOC ファイルには、多くのシナリオで大量のテキスト データやビジュアル データが含まれる場合があります。 Word ファイルからすべての画像を抽出し、画像をテキスト データから分離する必要がある場合は、GroupDocs.Parser を利用した Cloud SDK および REST API を活用できます。実際、GroupDocs.Parser Cloud SDKs for Node.js によって公開されているメソッドを使用して、JavaScript で画像ファイル抽出プログラムを構築できます。それでは、先に進んで、Node.js で Word から画像を抽出する方法を見てみましょう。さらに、機能を実装するための手順とコード スニペットを確認します。

以下の点について説明します。

ワープロソフトのインストール

ライブラリのインストール手順は、迅速なアプリケーション開発において重要な役割を果たします。幸いなことに、GroupDocs.Parser Cloud SDKs for Node.js のインストール プロセスは、npm install MODULENAME を使用して Node.js モジュールをインストールするのとまったく同じです。したがって、次のコマンドを実行して、この豊富な機能を備えたイメージ ファイル抽出ライブラリをインストールします。

npm install groupdocs-parser-cloud

次のフェーズでは、Node.js プロジェクトを使用してこのライブラリをセットアップします。この目的のために、API クラウド ダッシュボード から API 資格情報 (クライアント ID、クライアント シークレット) を取得します。

API 認証情報の取得に問題がある場合は、この ガイド を参照してください。

Node.js で Word から画像を抽出する

API Cloud ダッシュボードにはソース DOC/DOCX ファイルがあり、UploadFile メソッドを呼び出して手動またはプログラムでアップロードできます。

次の手順は、Node.js で Word から画像を抽出する方法を示しています。

  • プロジェクトで groupdocs-parser-cloud を取得します。
  • クライアント ID とクライアント シークレットを使用して、Configuration クラスのインスタンスをインスタンス化します。
  • fromConfig メソッドを呼び出し、Configuration クラスのオブジェクトを渡します。
  • FileInfo クラスのオブジェクトを作成し、ソース DOCX ファイルのパスを定義します。
  • ImagesOptions クラスのインスタンスを作成して、画像オプションを定義します。
  • ImagesRequest クラスのオブジェクトを初期化し、ImagesOptions クラスのインスタンスを渡します。
  • images メソッドを呼び出して、Word 文書から画像を抽出します。

次のコード スニペットをコピーして貼り付けて、独自のワープロ ソフトウェアを構築します。

// プロジェクトで groupdocs-parser-cloud を取得します。
const groupdocs_parser_cloud = require("groupdocs-parser-cloud");
// API 認証情報を定義します。
let clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
let clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
// クライアント ID とクライアント シークレットを使用して、Configuration クラスのインスタンスをインスタンス化します。
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
// fromConfig メソッドを呼び出し、Configuration クラスのオブジェクトを渡します。
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// FileInfo クラスのオブジェクトを作成し、ソース DOCX ファイルのパスを定義します。
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// ImagesOptions クラスのインスタンスを作成して、画像オプションを定義します。
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// ImagesRequest クラスのオブジェクトを初期化し、ImagesOptions クラスのインスタンスを渡します。
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// Images メソッドを呼び出して、Word 文書から画像を抽出します。
parseApi.images(request)
.then((result)=>{
// 結果を示す
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
})

以下の画像で、上記のコード サンプルの出力を確認できます。

画像ファイル抽出ツール

オンライン画像抽出ツール

この オンライン ツールを最大限に活用して、Word ファイルから画像を抽出できます。何よりも、GroupDocs.Parser Cloud SDK によってもサポートされています。さらに、Web ベースであり、無料でアカウントの作成やサブスクリプションが必要ないため、堅牢な変換および操作機能を提供します。

オンライン画像抽出ツール

結論

結局のところ、ワードプロセッサ ソフトウェアの開発には GroupDocs.Parser Cloud SDK を考慮しても問題ありません。インストールとセットアップは非常に簡単で、呼び出すことができるメソッドは非常に豊富です。さらに、この機能をオンラインで実現するための オンライン 画像抽出ツールもあります。さらに詳しく調べるには、ドキュメント および GitHub リポジトリを参照してください。さらに、開発を開始するには、Getting Started Guide を参照してください。

最後に、groupdocs.cloud が新しい記事を書いています。定期的に最新情報をお知らせいたしますので、よろしくお願いいたします。

ヘルプが利用可能です

ご質問やご質問については、フォーラム でお知らせください。

よくある質問 – FAQ

Word から画像を抽出するにはどうすればよいですか?

GroupDocs.Parser Cloud SDK を使用して、DOCX/DOC ファイルからプログラム的に画像を抽出できます。詳細については、リンクをご覧ください。

関連項目