Node.js の Rest API を使用して PDF ファイルからページを抽出する方法

Node.js の Rest API を使用して PDF ファイルからページを抽出する方法

PDF から複数のページをプログラムで一度に抽出する必要がある場合があります。 PDF ページを分割することで、PDF ドキュメントの特定のページを簡単にエクスポートして保存し、関係者と共有することができます。 Node.js 開発者は、クラウド上の PDF ドキュメントから複数のページを抽出できます。この記事では、Node.js の Rest API を使用して PDF ファイルからページを抽出する方法を説明します。

PDF からページを取得するために、この記事では次のトピックについて説明します。

PDF エクストラクター REST API および Node.js SDK

PDF adobe acrobat からページを抽出するには、GroupDocs.Merger Cloud の Node.js SDK API を使用します。これは、オンライン PDF ページ抽出ツールの無料ダウンロード ライブラリです。 サポートされている文書形式WordExcelPowerPoint から単一ページまたはページの集合を分割、結合、抽出、削除、再配置することができます。 ]、Visio 図面PDFHTML

GroupDocs.Merger クラウドをインストールすると、コンソールで次のコマンドを使用して、Node.js アプリケーションの PDF ファイルから PDF ページを抽出できます。

npm install groupdocs-merger-cloud

上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、以下に示すようにコードを追加します。

# http://api.groupdocs.cloud から Node.js SDK をノード アプリケーションにインポートします
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// https://dashboard.groupdocs.cloud から clientId と clientSecret を取得します (無料の登録が必要です)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Node.js の REST API を使用して正確なページ番号で PDF ページを抽出する

以下に説明する簡単な手順に従って、PDF から単一のページをエクスポートしたり、PDF ファイルから特定のページをプログラムによってクラウド上にエクスポートしたりできます。

PDF ファイルをアップロードする

以下に示すコード例を使用して、PDF ファイルをクラウドにインポートすることから始めることができます。

// システム ドライブから IOStream 内のファイルを開きます。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// ファイルを読み取る
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi を構築する
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // アップロードファイルリクエストの作成
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // ファイルをアップロードする
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

PDF ファイルは、クラウド上のダッシュボードの ファイル セクション にファイルがアップロードされると利用できるようになります。

Node.js で REST API を使用して PDF ページを抽出する

以下の手順では、PDF ファイルからプログラムでページを抽出する方法を説明します。

  • まず、PagesApiのインスタンスを作成します。
  • ExtractOptions のインスタンスを作成します。
  • FileInfo のインスタンスを作成します。
  • 次に、入力 PDF ファイルへのパスを設定します。
  • 次に、抽出したPDFファイルへのパスを設定します。
  • PDF ファイルを抽出するには、カンマ区切りの配列で特定のページ番号を設定します。
  • ExtractOptions を使用して ExtractRequest を作成します。
  • 最後に、ExtractRequest で pagesApi.extract() メソッドを呼び出して結果を取得します。

次のコード スニペットは、Node.js の REST API を使用して PDF ページを別のファイルに抽出する方法を示しています。

// Node.js の REST API を使用して正確なページ番号で PDF ページを抽出する方法
const extractpdfpages = async () => {

  // APIの初期化
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // 抽出オプションを定義する
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // 抽出リクエストを作成する
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // PDF ドキュメントからページを抽出する
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

抽出したファイルをダウンロードする

上記のコードサンプルでは、分割したファイルをクラウド上に保存します。次のコード サンプルを使用してダウンロードできます。

// マージされたファイルをダウンロードするための FileApi を構築する
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// ダウンロードファイルリクエストの作成
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// ダウンロード ファイルと応答タイプ ストリーム
fileApi.downloadFile(request)
    .then(function (response) {
        // ファイルをシステムディレクトリに保存します
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Node.js の REST API を使用して PDF からページ範囲ごとにページを抽出する

以下の手順に従って、プログラムでページ番号の範囲を指定することで、PDF からページを個別に抽出して保存できます。

  • まず、PagesApiのインスタンスを作成します。
  • ExtractOptions のインスタンスを作成します。
  • FileInfo のインスタンスを作成します。
  • 次に、入力 PDF ファイルへのパスを設定します。
  • 次に、抽出したPDFファイルへのパスを設定します。
  • 開始ページ番号と終了ページ番号の値を設定します。
  • 次に、rangeMode を EvenPages または OddPages に設定します。
  • ExtractOptions を使用して ExtractRequest を作成します。
  • 最後に、ExtractRequest で pagesApi.extract() メソッドを呼び出して結果を取得します。

次のコード スニペットは、Node.js のページ範囲とページ モードを使用して PDF オンラインでページを抽出する方法を示しています。

// Node.js の REST API を使用して PDF からページ範囲ごとにページを抽出する方法
const extractpages = async () => {

  // APIの初期化
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // 抽出オプションを定義する
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // 抽出リクエストを作成する
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // PDF ファイルのページを抽出する
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

同様の方法で、PDF ドキュメントから奇数ページを抽出することができます。

オンラインで試す

オンラインで PDF ファイルからページを抽出するにはどうすればよいですか?オンラインで PDF からページを無料で抽出するには、次の 無料オンライン PDF 抽出ツール をお試しください。この PDF ページ抽出無料オンライン ツールは、上記の API を使用して開発されています。

結論

このブログ投稿はここで終了します。この記事では、次のことを学びました。

  • REST APIを使用してオンラインでPDFから特定のページを抽出する方法、またはPDFから1ページを抽出する方法。
  • ページ範囲と範囲モード フィルターを使用して PDF ドキュメントからページを抽出する方法。
  • PDF ファイルをクラウドにアップロードして、選択したページを PDF からオンラインでエクスポートします。
  • PDF の特定のページをクラウドからダウンロードして保存します。
  • PDFからページを無料で抽出する方法;

これで、PDF ドキュメントから 1 ページを抽出する方法、または PDF の特定のページを保存する方法がわかりました。また、この API を使用すると、ドキュメント ページの並べ替えや置換、ページの向きの変更、ドキュメントのパスワードの管理など、サポートされているファイル形式に対するその他の操作を簡単に行うことができます。さらに、GroupDocs.Merge Cloud API の詳細については、ドキュメント を使用して学習できます。また、ブラウザーを通じて API を直接視覚化して操作できる API リファレンス セクションも提供しています。

さらに、スタート ガイド を参照することをお勧めします。

さらに、groupdocs.cloud は新しいトピックに関する記事を定期的に執筆しています。最新の更新情報については、引き続きご連絡ください。

質問する

PDF ファイルを抽出して PDF から選択したページをエクスポートする方法に関する質問は、無料サポート フォーラム から行うことができます。

よくある質問

PDF から複数のページを 1 つのファイルに抽出するにはどうすればよいですか?

PDF ファイルをプログラムでオンラインで複数のページに分割するための JS ライブラリ をインストールします。 API の詳細については、ドキュメントを参照してください。

PDF から特定のページを抽出するのにどれくらい時間がかかりますか?

JavaScript HTML to PDF ライブラリ は非常に高速に動作し、保護された PDF から数秒で簡単にページを抽出できます。

関連項目

最適な読み物と情報については、次の記事を参照してください。