DOCX/DOC ファイルには、多くのシナリオで大量のテキスト データやビジュアル データが含まれる場合があります。 Word ファイルからすべての画像を抽出し、画像をテキスト データから分離する必要がある場合は、GroupDocs.Parser を利用した Cloud SDK および REST API を活用できます。実際、GroupDocs.Parser Cloud SDKs for Node.js によって公開されているメソッドを使用して、JavaScript で画像ファイル抽出プログラムを構築できます。それでは、先に進んで、Node.js で Word から画像を抽出する方法を見てみましょう。さらに、機能を実装するための手順とコード スニペットを確認します。
以下の点について説明します。
ワープロソフトのインストール
ライブラリのインストール手順は、迅速なアプリケーション開発において重要な役割を果たします。幸いなことに、GroupDocs.Parser Cloud SDKs for Node.js のインストール プロセスは、npm install MODULENAME を使用して Node.js モジュールをインストールするのとまったく同じです。したがって、次のコマンドを実行して、この豊富な機能を備えたイメージ ファイル抽出ライブラリをインストールします。
npm install groupdocs-parser-cloud
次のフェーズでは、Node.js プロジェクトを使用してこのライブラリをセットアップします。この目的のために、API クラウド ダッシュボード から API 資格情報 (クライアント ID、クライアント シークレット) を取得します。
API 認証情報の取得に問題がある場合は、この ガイド を参照してください。
Node.js で Word から画像を抽出する
API Cloud ダッシュボードにはソース DOC/DOCX ファイルがあり、UploadFile メソッドを呼び出して手動またはプログラムでアップロードできます。
次の手順は、Node.js で Word から画像を抽出する方法を示しています。
- プロジェクトで groupdocs-parser-cloud を取得します。
- クライアント ID とクライアント シークレットを使用して、Configuration クラスのインスタンスをインスタンス化します。
- fromConfig メソッドを呼び出し、Configuration クラスのオブジェクトを渡します。
- FileInfo クラスのオブジェクトを作成し、ソース DOCX ファイルのパスを定義します。
- ImagesOptions クラスのインスタンスを作成して、画像オプションを定義します。
- ImagesRequest クラスのオブジェクトを初期化し、ImagesOptions クラスのインスタンスを渡します。
- images メソッドを呼び出して、Word 文書から画像を抽出します。
次のコード スニペットをコピーして貼り付けて、独自のワープロ ソフトウェアを構築します。
// プロジェクトで groupdocs-parser-cloud を取得します。
const groupdocs_parser_cloud = require("groupdocs-parser-cloud");
// API 認証情報を定義します。
let clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
let clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
// クライアント ID とクライアント シークレットを使用して、Configuration クラスのインスタンスをインスタンス化します。
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
// fromConfig メソッドを呼び出し、Configuration クラスのオブジェクトを渡します。
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// FileInfo クラスのオブジェクトを作成し、ソース DOCX ファイルのパスを定義します。
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// ImagesOptions クラスのインスタンスを作成して、画像オプションを定義します。
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// ImagesRequest クラスのオブジェクトを初期化し、ImagesOptions クラスのインスタンスを渡します。
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// Images メソッドを呼び出して、Word 文書から画像を抽出します。
parseApi.images(request)
.then((result)=>{
// 結果を示す
let images = result.images;
images.forEach(image => {
console.log("Image path in storage: " + image.path);
console.log("Download url: " + image.downloadUrl);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
})
以下の画像で、上記のコード サンプルの出力を確認できます。
オンライン画像抽出ツール
この オンライン ツールを最大限に活用して、Word ファイルから画像を抽出できます。何よりも、GroupDocs.Parser Cloud SDK によってもサポートされています。さらに、Web ベースであり、無料でアカウントの作成やサブスクリプションが必要ないため、堅牢な変換および操作機能を提供します。
結論
結局のところ、ワードプロセッサ ソフトウェアの開発には GroupDocs.Parser Cloud SDK を考慮しても問題ありません。インストールとセットアップは非常に簡単で、呼び出すことができるメソッドは非常に豊富です。さらに、この機能をオンラインで実現するための オンライン 画像抽出ツールもあります。さらに詳しく調べるには、ドキュメント および GitHub リポジトリを参照してください。さらに、開発を開始するには、Getting Started Guide を参照してください。
最後に、groupdocs.cloud が新しい記事を書いています。定期的に最新情報をお知らせいたしますので、よろしくお願いいたします。
ヘルプが利用可能です
ご質問やご質問については、フォーラム でお知らせください。
よくある質問 – FAQ
Word から画像を抽出するにはどうすればよいですか?
GroupDocs.Parser Cloud SDK を使用して、DOCX/DOC ファイルからプログラム的に画像を抽出できます。詳細については、リンクをご覧ください。