PDF スプリッター - Ruby の Rest API を使用して PDF からページを抽出する方法

Ruby の Rest API を使用して PDF からページを抽出する方法

PDF ドキュメントから特定のページを抽出する必要がある場合や、PDF を小さな部分として個々のページに分割する必要がある場合があります。 Ruby 開発者は、PDF Adobe Reader からページ番号またはプログラムでページ範囲を指定して簡単にページを抽出できます。この記事では、Ruby の REST API を使用して PDF からページを抽出する方法と、PDF からオンラインで無料でページを抽出する方法を学びます。

このチュートリアルでは、PDF を別のページに変換するために次のトピックについて説明します。

PDF スプリッター REST API と Ruby SDK

PDF をページに分割するには、PDF 抽出ツールの無料ダウンロード クラウド API GroupDocs.Merger の Ruby SDK を使用します。これは、PDF から 1 ページを保存するため、または PDF の特定のページを 1 つのドキュメントに保存する方法に使用される、機能が豊富で高性能な Cloud SDK です。また、Adobe Acrobat が PDF からページを複数のファイルに抽出することも可能になります。 SDK は、ページ全体または優先範囲のページの向きを交換、移動、削除、回転、または変更する機能を提供します。 PDF、Word、Powerpoint, Excel ワークシートなど、サポートされているファイル形式に対して他の操作を簡単に実行できます。 ドキュメント マージ ファミリー メンバーとして、.NET、Java、PHP、Python、Android、および Node.js SDK をサポートしています。

コンソールで次のコマンドを使用して、GroupDocs.Merger-Cloud をインストールして Ruby プロジェクトの PDF からページを選択できます。

gem install groupdocs_merger_cloud

手順と利用可能なコード例に従う前に、ダッシュボード からクライアント ID とクライアント シークレットを取得してください。 ID とシークレットを取得したら、以下に示すコードを追加して PDF ファイルをページに分割します。

# http://api.groupdocs.cloud の Ruby アプリケーションに gem https://github.com/groupdocs-merger-cloud/groupdocs-merger-cloud-ruby をロードします。
require 'groupdocs_merger_cloud'

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
@app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

REST APIを使用してPDFから特定のページを抽出する

アップロードされた PDF ファイルから、ページ番号を指定して PDF の特定のページを保存できます。まず、複数ページの PDF ドキュメントをクラウドに アップロードすると、ダッシュボードの ファイル セクションで PDF ファイルが利用できるようになります。 PDF ドキュメントから PDF の特定のページをプログラムで保存するには、以下の手順に従ってください。

  • まず、インスタンスを作成します PagesApi
  • 次に、ExtractOptions インスタンスを作成します
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスと出力ディレクトリのパスを設定します。
  • 抽出するページ番号をカンマ区切りで指定します
  • 次に、ExtractRequest のインスタンスを作成します。
  • 最後に、ExtractRequest で PagesApi.extract() メソッドを呼び出して PDF ページを抽出します。

次のコード例は、REST API を使用して PDF ドキュメントから特定のページ番号を指定してファイルを抽出する方法を示しています。

# Pages API のインスタンスを作成する
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
 
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-specific-pages.pdf"
@options.pages = [2, 4, 7, 13]
 
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted specific pages by number.")

上記のコード サンプルは、抽出されたページを別の PDF ファイルとしてクラウド上に保存します。

PDF から偶数ページ範囲でページを抽出

プログラムでページ範囲を指定して PDF からドキュメントを抽出する方法については、以下の手順に従ってください。

  • まず、インスタンスを作成します PagesApi
  • 次に、ExtractOptions インスタンスを作成します
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスと出力ディレクトリのパスを設定します。
  • start\page\number および end\page\number オプションを提供します
  • range\mode を EvenPages に設定します
  • 次に、ExtractRequest のインスタンスを作成します。
  • 最後に、ExtractRequest で PagesApi.extract() メソッドを呼び出して PDF ページを抽出します。

次のコード例は、REST API を使用して PDF ドキュメントからページ範囲を提供することにより、PDF 内のページを分割することを示しています。前述の手順に従ってファイルをアップロードしてください。

# Pages API のインスタンスを作成する
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
 
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-even-pages.pdf"
@options.start_page_number = 1
@options.end_page_number = 10
@options.range_mode = "EvenPages"
 
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted pages by even range.")

奇数ページ範囲で PDF からページを抽出

プログラムでページ範囲を指定して PDF ドキュメントからページを抽出するには、以下の手順に従ってください。

  • まず、インスタンスを作成します PagesApi
  • 次に、ExtractOptions インスタンスを作成します
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスと出力ディレクトリのパスを設定します。
  • start\page\number および end\page\number オプションを提供します
  • range\mode を OddPages に設定します
  • 次に、ExtractRequest のインスタンスを作成します。
  • 最後に、ExtractRequest で PagesApi.extract() メソッドを呼び出して PDF ページを抽出します。

次のコード例では、REST API を使用して PDF ドキュメントからページ範囲を指定することにより、PDF ファイルから PDF ページを抽出します。前述の手順に従ってファイルをアップロードしてください。

# Pages API のインスタンスを作成する
@pagesApi = GroupDocsMergerCloud::PagesApi.from_keys(@app_sid, @app_key)
 
@options = GroupDocsMergerCloud::ExtractOptions.new
@options.file_info = GroupDocsMergerCloud::FileInfo.new
@options.file_info.file_path = 'extract-pages/extract-21pages.pdf'
@options.output_path = "extract-pages/extract-odd-pages.pdf"
@options.start_page_number = 1
@options.end_page_number = 15
@options.range_mode = "OddPages"
 
@result = @pagesApi.extract(GroupDocsMergerCloud::ExtractRequest.new(@options))
puts("Successfully extracted pages by odd range.")

Rest API を使用して、PDF ファイルをページ範囲ごとに分割したり、すべての PDF ページを複数の PDF ファイルに抽出したりできるようになりました。

PDF スプリッターを使用して PDF ページをオンラインで抽出する

PDFからページを無料で抽出するにはどうすればよいですか?使いやすい無料のオンライン PDF ページ抽出ツールを使用して、オンラインで PDF ページを分割または抽出します。 PDF スプリッターを使用すると、PDF からページを無料で抽出できます。 PDF ページを分割するのは絶対に安全です。 今日試してみましょう

まとめ

この記事では、Ruby を使用してクラウド上の PDF ドキュメントからページを抽出する方法を学びました。また、クラウド上でプログラム的に PDF をページ範囲またはページ番号に基づいてページに分割する方法も学びました。これで、PDF から 1 ページをエクスポートする方法と、PDF ファイルから複数のページをすばやく抽出する方法がわかりました。 GroupDocs.Merger Cloud API の詳細については、ドキュメント を使用して学習できます。また、ブラウザーを通じて直接 API を視覚化し操作できるようにする API リファレンス セクションも提供しています。

質問する

PDF から 1 ページを抽出する方法、または PDF を複数のページに分割する方法についてご質問がある場合は、フォーラム でお気軽にお問い合わせください。

関連項目