Node.js の Rest API を使用して PDF ファイルからページを抽出する方法

PDF から複数のページをプログラムで一度に抽出する必要がある場合があります。 PDF ページを分割することで、PDF ドキュメントの特定のページを簡単にエクスポートして保存し、関係者と共有することができます。 Node.js 開発者は、クラウド上の PDF ドキュメントから複数のページを抽出できます。この記事では、Node.js の Rest API を使用して PDF ファイルからページを抽出する方法を説明します。

PDF からページを取得するために、この記事では次のトピックについて説明します。

PDF エクストラクター REST API および Node.js SDK
Node.js の REST API を使用して正確なページ番号で PDF ページを抽出
Node.js の REST API を使用して PDF からページ範囲ごとにページを抽出

PDF エクストラクター REST API および Node.js SDK

PDF adobe acrobat からページを抽出するには、GroupDocs.Merger Cloud の Node.js SDK API を使用します。これは、オンライン PDF ページ抽出ツールの無料ダウンロードライブラリです。サポートされている文書形式、Word、Excel、PowerPoint から単一ページまたはページの集合を分割、結合、抽出、削除、再配置することができます。 ]、Visio 図面、PDF、HTML。

GroupDocs.Merger クラウドをインストールすると、コンソールで次のコマンドを使用して、Node.js アプリケーションの PDF ファイルから PDF ページを抽出できます。

npm install groupdocs-merger-cloud

上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、以下に示すようにコードを追加します。

# http://api.groupdocs.cloud から Node.js SDK をノード アプリケーションにインポートします
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// https://dashboard.groupdocs.cloud から clientId と clientSecret を取得します (無料の登録が必要です)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Node.js の REST API を使用して正確なページ番号で PDF ページを抽出する

以下に説明する簡単な手順に従って、PDF から単一のページをエクスポートしたり、PDF ファイルから特定のページをプログラムによってクラウド上にエクスポートしたりできます。

PDFファイルをクラウドにアップロード
Node.js で REST API を使用した抽出 PDF ページ
分割したファイルをダウンロード

PDF ファイルをアップロードする

以下に示すコード例を使用して、PDF ファイルをクラウドにインポートすることから始めることができます。

// システム ドライブから IOStream 内のファイルを開きます。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// ファイルを読み取る
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi を構築する
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // アップロードファイルリクエストの作成
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // ファイルをアップロードする
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

PDF ファイルは、クラウド上のダッシュボードのファイルセクションにファイルがアップロードされると利用できるようになります。

Node.js で REST API を使用して PDF ページを抽出する

以下の手順では、PDF ファイルからプログラムでページを抽出する方法を説明します。

まず、PagesApiのインスタンスを作成します。
ExtractOptions のインスタンスを作成します。
FileInfo のインスタンスを作成します。
次に、入力 PDF ファイルへのパスを設定します。
次に、抽出したPDFファイルへのパスを設定します。
PDF ファイルを抽出するには、カンマ区切りの配列で特定のページ番号を設定します。
ExtractOptions を使用して ExtractRequest を作成します。
最後に、ExtractRequest で pagesApi.extract() メソッドを呼び出して結果を取得します。

次のコードスニペットは、Node.js の REST API を使用して PDF ページを別のファイルに抽出する方法を示しています。

// Node.js の REST API を使用して正確なページ番号で PDF ページを抽出する方法
const extractpdfpages = async () => {

  // APIの初期化
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // 抽出オプションを定義する
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // 抽出リクエストを作成する
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // PDF ドキュメントからページを抽出する
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

抽出したファイルをダウンロードする

上記のコードサンプルでは、分割したファイルをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。

// マージされたファイルをダウンロードするための FileApi を構築する
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// ダウンロードファイルリクエストの作成
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// ダウンロード ファイルと応答タイプ ストリーム
fileApi.downloadFile(request)
    .then(function (response) {
        // ファイルをシステムディレクトリに保存します
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Node.js の REST API を使用して PDF からページ範囲ごとにページを抽出する

以下の手順に従って、プログラムでページ番号の範囲を指定することで、PDF からページを個別に抽出して保存できます。

まず、PagesApiのインスタンスを作成します。
ExtractOptions のインスタンスを作成します。
FileInfo のインスタンスを作成します。
次に、入力 PDF ファイルへのパスを設定します。
次に、抽出したPDFファイルへのパスを設定します。
開始ページ番号と終了ページ番号の値を設定します。
次に、rangeMode を EvenPages または OddPages に設定します。
ExtractOptions を使用して ExtractRequest を作成します。
最後に、ExtractRequest で pagesApi.extract() メソッドを呼び出して結果を取得します。

次のコードスニペットは、Node.js のページ範囲とページモードを使用して PDF オンラインでページを抽出する方法を示しています。

// Node.js の REST API を使用して PDF からページ範囲ごとにページを抽出する方法
const extractpages = async () => {

  // APIの初期化
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // 抽出オプションを定義する
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // 抽出リクエストを作成する
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // PDF ファイルのページを抽出する
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

同様の方法で、PDF ドキュメントから奇数ページを抽出することができます。

オンラインで試す

オンラインで PDF ファイルからページを抽出するにはどうすればよいですか?オンラインで PDF からページを無料で抽出するには、次の無料オンライン PDF 抽出ツールをお試しください。この PDF ページ抽出無料オンラインツールは、上記の API を使用して開発されています。

結論

このブログ投稿はここで終了します。この記事では、次のことを学びました。

REST APIを使用してオンラインでPDFから特定のページを抽出する方法、またはPDFから1ページを抽出する方法。
ページ範囲と範囲モードフィルターを使用して PDF ドキュメントからページを抽出する方法。
PDF ファイルをクラウドにアップロードして、選択したページを PDF からオンラインでエクスポートします。
PDF の特定のページをクラウドからダウンロードして保存します。
PDFからページを無料で抽出する方法;

これで、PDF ドキュメントから 1 ページを抽出する方法、または PDF の特定のページを保存する方法がわかりました。また、この API を使用すると、ドキュメントページの並べ替えや置換、ページの向きの変更、ドキュメントのパスワードの管理など、サポートされているファイル形式に対するその他の操作を簡単に行うことができます。さらに、GroupDocs.Merge Cloud API の詳細については、ドキュメントを使用して学習できます。また、ブラウザーを通じて API を直接視覚化して操作できる API リファレンスセクションも提供しています。

さらに、スタートガイドを参照することをお勧めします。

さらに、groupdocs.cloud は新しいトピックに関する記事を定期的に執筆しています。最新の更新情報については、引き続きご連絡ください。

質問する

PDF ファイルを抽出して PDF から選択したページをエクスポートする方法に関する質問は、無料サポートフォーラムから行うことができます。

よくある質問

PDF から複数のページを 1 つのファイルに抽出するにはどうすればよいですか?

PDF ファイルをプログラムでオンラインで複数のページに分割するための JS ライブラリをインストールします。 API の詳細については、ドキュメントを参照してください。

PDF から特定のページを抽出するのにどれくらい時間がかかりますか?

JavaScript HTML to PDF ライブラリは非常に高速に動作し、保護された PDF から数秒で簡単にページを抽出できます。

PDF エクストラクター REST API および Node.js SDK#

Node.js の REST API を使用して正確なページ番号で PDF ページを抽出する#

PDF ファイルをアップロードする#

Node.js で REST API を使用して PDF ページを抽出する#

抽出したファイルをダウンロードする#

Node.js の REST API を使用して PDF からページ範囲ごとにページを抽出する#

オンラインで試す#

結論#

質問する#

よくある質問#

関連項目#