Node.js を使用してオンラインで Word 文書からページを抽出する方法

Node.js を使用して Word DOC/DOCX Online からページを抽出する方法

word ドキュメント ページをプログラムで複数のドキュメントに抽出する必要がある場合があります。 Word 文書を分割すると、Word 文書から簡単にページを抽出し、特定の情報やデータを関係者と共有できます。 Node.js 開発者は、クラウド上のオンラインで Word ドキュメントを個別のファイルに抽出できます。この記事では、Node.js を使用してオンラインで Word DOC/DOCX からページを抽出する方法を学習します。

この記事では次のトピックについて説明します。

Word Page Extractor Online REST API と Node.js SDK

Word 文書からページを抽出するには、GroupDocs.Merger Cloud の Node.js SDK API を使用します。オンライン Word ページ抽出ツールの無料ダウンロード ライブラリです。 サポートされている文書形式WordExcelPowerPoint から単一ページまたはページの集合を分割、結合、抽出、削除、再配置することができます。 ]、Visio 図面PDFHTML

コンソールで次のコマンドを使用して、GroupDocs.Merger クラウドをインストールし、Node.js アプリケーションから Word ページを抽出できます。

npm install groupdocs-merger-cloud

上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、以下に示すようにコードを追加します。

# http://api.groupdocs.cloud から Node.js SDK をノード アプリケーションにインポートします
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// https://dashboard.groupdocs.cloud から clientId と clientSecret を取得します (無料の登録が必要です)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

正確なページ番号を使用して Word から新しい文書にページを抽出する

以下に説明する簡単な手順に従って、プログラムによって Word ファイルから特定のページをクラウド上にエクスポートできます。

Wordファイルをアップロードする

まず、以下のコード例を使用して、Word ファイルをクラウドにアップロードします。

// システム ドライブから IOStream 内のファイルを開きます。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// ファイルを読み取る
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi を構築する
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // アップロードファイルリクエストの作成
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
  // ファイルをアップロードする
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

その結果、アップロードされた Word ファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Node.js で REST API を使用して Word ページを抽出する

以下の手順に従って、Word ファイルのページをプログラムで簡単に抽出できます。

  • まず、PagesApiのインスタンスを作成します。
  • ExtractOptions のインスタンスを作成します。
  • FileInfo のインスタンスを作成します。
  • 次に、入力 Word ファイルへのパスを設定します。
  • 次に、抽出したWordファイルへのパスを設定します。
  • Word ファイルを抽出するには、カンマ区切りの配列で特定のページ番号を設定します。
  • ExtractOptions を使用して ExtractRequest を作成します。
  • 最後に、ExtractRequest で pagesApi.extract() メソッドを呼び出して結果を取得します。

次のコード スニペットは、Node.js の REST API を使用して Word ページを別のファイルに抽出する方法を示しています。

// 正確なページ番号を使用して Word からページを新しい文書に抽出する方法
const extractwordpages = async () => {

  // APIの初期化
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // 抽出オプションを定義する
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.pages = [2, 4, 7];
  
  try {
    // 抽出リクエストを作成する
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // docx ファイルからページを抽出する
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractwordpages()
.then(() => {
  console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file:", err);
})

抽出したファイルをダウンロードする

上記のコードサンプルでは、分割したファイルをクラウド上に保存します。次のコード サンプルを使用してダウンロードできます。

// マージされたファイルをダウンロードするための FileApi を構築する
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// ダウンロードファイルリクエストの作成
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// ダウンロード ファイルと応答タイプ ストリーム
fileApi.downloadFile(request)
    .then(function (response) {
        // ファイルをシステムディレクトリに保存します
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Node.js の REST API を使用して Word ドキュメント ページをページ範囲ごとに抽出する

以下の手順に従って、プログラムでページ番号の範囲を指定することで、Word からページを個別に抽出して保存できます。

  • まず、PagesApiのインスタンスを作成します。
  • ExtractOptions のインスタンスを作成します。
  • FileInfo のインスタンスを作成します。
  • 次に、入力 Word ファイルへのパスを設定します。
  • 次に、抽出したWordファイルへのパスを設定します。
  • startPageNumber と endPageNumber の値を設定します。
  • 次に、rangeMode を EvenPages または OddPages に設定します。
  • ExtractOptions を使用して ExtractRequest を作成します。
  • 最後に、ExtractRequest で pagesApi.extract() メソッドを呼び出して結果を取得します。

次のコード スニペットは、Node.js のページ範囲とページ モードを使用して Word オンラインからページを抽出する方法を示しています。

// Node.js の REST API を使用して Word ドキュメントのページをページ範囲ごとに抽出する方法
const extractpages = async () => {

  // APIの初期化
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // 抽出オプションを定義する
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // 抽出リクエストを作成する
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // Word ファイルのページを抽出する
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file.", err);
})

同様の方法で、Word 文書から奇数ページを抽出することができます。

オンラインで試す

オンラインでWord文書からページを抽出するにはどうすればよいですか?オンラインで Word からページを無料で抽出するには、次の 無料のオンライン Word 抽出ツール を試してください。この Word ページ抽出ツールの無料オンライン ツールは、上記の API を使用して開発されています。

結論

この記事では、次のことを学びました。

  • REST APIを使用してオンラインでWord文書から特定のページを抽出する方法。
  • ページ範囲と範囲モード フィルターを使用して Word 文書からページを抽出する方法。
  • Word ファイルをクラウドにアップロードして、選択したページを Word からオンラインでエクスポートします。
  • Word の特定のページをクラウドからダウンロードして保存します。
  • Wordからページを無料で抽出する方法;

これで、Word 文書からすべてのページを抽出する方法、または Word の特定のページを保存する方法がわかりました。また、この API を使用すると、ドキュメント ページの並べ替えや置換、ページの向きの変更、ドキュメントのパスワードの管理など、サポートされているファイル形式に対するその他の操作を簡単に行うことができます。さらに、ドキュメント を使用して、GroupDocs.Merge Cloud API について詳しく学ぶことができます。また、ブラウザーを通じて API を直接視覚化して操作できる API リファレンス セクションも提供しています。

質問する

無料サポート フォーラム 経由で、Word から選択したページをエクスポートするための Word ページ抽出ツールに関する質問をすることができます。

よくある質問

Word から複数のページを 1 つのファイルに抽出するにはどうすればよいですか?

Word ファイルをプログラムでオンラインで複数のページに分割するための JS ライブラリ をインストールします。 API の詳細については、ドキュメントを参照してください。

Word から特定のページを抽出するのにどれくらい時間がかかりますか?

JavaScript HTML to Word ライブラリ は非常に高速に動作し、保護された Word から数秒で簡単にページを抽出できます。

関連項目