Python で PDF ファイルを複数の PDF に分割する方法

Python ドキュメントの分割 - Python を使用して PDF ファイルを複数の PDF ファイルに分割します。

PDF(Portable Document Format) は、共有、印刷、またはアーカイブする必要があるドキュメントに広く使用されているファイル形式です。複数のドキュメントやセクションを含む大きな PDF ファイルを扱うことにうんざりしていませんか? 1 つの PDF ファイルから特定のページまたはセクションを別のドキュメントとして抽出するのは難しいと思いますか? PDF ファイルを複数の小さなファイルに分割すると、ドキュメント管理タスクが大幅に簡素化されます。この記事では、GroupDocs.Merger Cloud SDK for Python を使用して、Python で PDF ファイルを複数の PDF ファイルに分割する方法を説明します。

この記事では次のトピックについて説明します。

PDF をページに分割し SDK をインストールするための Python REST API

GroupDocs.Merger Cloud SDK for Python は、PDF ファイルをプログラムで操作できる強力で機能が豊富なソフトウェア開発キットです。 サポートされているドキュメント形式 のページのコレクションの分割、結合、回転、再配置など、さまざまな機能を提供します。 SDK を Python ベースのアプリケーションに統合して、開発プロセスを簡素化し、生産性を向上させることができます。

ターミナルで次のコマンドを実行すると、PyPI から PIP を使用して Python アプリケーションに Merger API をインストールできます。

pip install groupdocs-merger-cloud

次に、GroupDocs Web サイトで無料トライアル アカウントにサインアップするか、サブスクリプション プランを購入してAPI キーを取得する必要があります。クライアント ID とクライアント シークレットを取得したら、以下のコード スニペットを Python ベースのアプリケーションに追加します。

# groupdocs Merger SDK をインポートする
import groupdocs_merger_cloud

# 無料登録後、https://dashboard.groupdocs.cloud から app_sid と app_key を取得します。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# ファイル API 構成を取得する 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Python で PDF ページを個別の PDF ファイルに分割する方法

GroupDocs.Merger Cloud SDK for Python を使用して PDF ファイルを複数の PDF ファイルに分割するには、次の手順に従います。

ファイルをアップロードします

まず、以下のコード例を使用して、PDF ファイルをクラウドにアップロードします。

# ファイルAPIのインスタンスを作成する
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# ファイルアップロードリクエストを呼び出す
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# ファイルをクラウドにアップロードする
response = file_api.upload_file(request)
print(response.uploaded)

その結果、アップロードされたファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Python で PDF を個々のページに分割する

このセクションでは、以下に示すように、プログラムによって PDF ページを個別の PDF ファイルに分割する手順とサンプル コード スニペットを記述します。

  • まず、DocumentApi クラスのインスタンスを作成します。
  • 次に、SplitOptions クラスのインスタンスを作成します。
  • 3 番目に、FileInfo クラスのインスタンスを作成します。
  • 入力ファイルのパスをパラメータとして FileInfo に指定します。
  • 次に、出力ディレクトリのパスを指定します。
  • 特定のページ番号をカンマ区切りの配列で設定します。
  • ここで、PDF 分割モードを「ページ」に設定して、ページ番号を分割します。
  • 次に、SplitRequest クラスのインスタンスを作成し、SplitOptions パラメーターを渡します。
  • 最後に、DocumentAPI.split() メソッドを呼び出し、SplitRequest パラメータを渡して結果を取得します。

次のコード スニペットは、REST API を使用して Python で PDF ファイルを分割する方法を示しています。

# Python で PDF ファイルを複数の単一 PDF ファイルに分割する方法
try:
	# Document API のインスタンスを作成する
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

ファイルをダウンロード

上記のサンプルコードでは、分割したファイルをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。

# ファイルをダウンロードするための API の初期化
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# ダウンロードファイルリクエストの作成
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# ダウンロードファイル
response = file_api.download_file(request)

# ダウンロードしたファイルをディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")

それでおしまい!

範囲フィルタを適用して PDF ドキュメントを個別のファイルに分割する

ページ範囲モードを提供することで PDF ファイルを分割し、以下の手順に従ってプログラムでフィルタリングすることができます。

  • まず、DocumentApi クラスのインスタンスを作成します。
  • 次に、SplitOptions クラスのインスタンスを作成します。
  • 3番目に、FileInfoクラスのインスタンスを作成します。
  • 入力ファイルのパスをパラメータとして FileInfo に指定します。
  • 次に、出力ディレクトリのパスを「python-testing」として指定します。
  • startpagenumber と endpagenumber の値を設定します。
  • 次に、ページ範囲モードを OddPages に設定します。
  • ここで、PDF 分割モードを「ページ」に設定して、ページ番号を分割します。
  • 次に、SplitRequest クラスのインスタンスを作成し、SplitOptions パラメーターを渡します。
  • 最後に、DocumentAPI.split() メソッドを呼び出し、SplitRequest パラメータを渡して結果を取得します。

次のコード スニペットは、REST API を使用して Python でフィルターを適用して PDF ファイルを分割する方法を示しています。

# フィルターを適用して PDF ファイルを複数の単一 PDF に分割する方法
try:
	# Document API のインスタンスを作成する
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Python で配列フィルタを適用して PDF ページを複数のファイルに分割する

このセクションでは、プログラムによって PDF ファイルを複数ページの PDF ファイルに分割する手順とサンプル コード スニペットを記述します。

  • まず、DocumentApi クラスのインスタンスを作成します。
  • 次に、SplitOptions クラスのインスタンスを作成します。
  • 3 番目に、FileInfo クラスのインスタンスを作成します。
  • 入力ファイルのパスをパラメータとして FileInfo に指定します。
  • 次に、出力ディレクトリのパスを「python-testing」として指定します。
  • 次に、ページコレクションを配列形式で設定します。
  • PDF ファイルを分割するには、PDF 分割モードを [間隔] に設定します。
  • 次に、SplitRequest クラスのインスタンスを作成し、SplitOptions パラメーターを渡します。
  • 最後に、DocumentAPI.split() メソッドを呼び出し、SplitRequest パラメータを渡して結果を取得します。

次のコード スニペットは、REST API を使用して Python で PDF ファイルを複数の PDF ファイルに分割する方法を示しています。

# Python で PDF ファイルを複数の複数ページのファイルに分割する方法
try:
	# Document API のインスタンスを作成する
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

無料のオンライン PDF スプリッター

PDF ファイルをオンラインで無料で分割するにはどうすればよいですか? PDF ドキュメントを無料で分割するには、次の オンライン PDF スプリッター ツールをお試しください。このドキュメント分割オンライン ツールは、上記の REST API を使用して開発されています。

結論

結論として、GroupDocs.Merger Cloud SDK for Python を使用して PDF ファイルを複数の PDF ファイルに分割すると、PDF ドキュメントを管理および操作する便利な方法が提供されます。この記事で学んだことは次のとおりです。

  • クラウド上で Python を使用して 1 つの PDF ファイルを複数のファイルに分割する方法。
  • クラウド上の Python でファイルをプログラム的にアップロードおよびダウンロードします。
  • ページ範囲フィルターを使用して、Python で PDF ファイルを複数のファイルに分割します。
  • オンライン PDF スプリッターを使用して PDF ファイルを無料で分割します。

さらに、ブラウザを通じて直接 API を視覚化し通信できるようにする API リファレンス セクション も提供しています。 Python SDK の完全なソース コードは GitHub で無料で入手できます。 GroupDocs.Merger Cloud SDK for Python ここに例があります を確認してください。

さらに、詳細な手順と API の使用方法については、スタート ガイド に従うことをお勧めします。

最後に、私たちは REST API を使用したさまざまなドキュメント操作に関する新しいブログ投稿を書き続けています。ですので、定期的に更新させていただきますので、お気軽にお問い合わせください。

質問する

PDF ドキュメント スプリッター API についてご質問がある場合は、無料サポート フォーラム でお気軽にお問い合わせください。

よくある質問

PDF ファイルを特定のページに基づいて複数のファイルに分割できますか?

はい、GroupDocs.Merger Cloud SDK for Python を使用すると、PDF を抽出して個別の PDF ファイルに分割するページの範囲を定義できます。

GroupDocs.Merger Cloud SDK for Python は PDF 以外のドキュメント形式をサポートしていますか?

はい、GroupDocs.Merger Cloud SDK for Python は、DOCX、XLSX、PPTX などを含むさまざまなドキュメント形式をサポートしています。これらのファイル タイプに対しても同様の操作を実行できます。

必要に応じて、分割された PDF ファイルを 1 つのファイルに結合することはできますか?

はい、GroupDocs.Merger Cloud SDK for Python も PDF ファイルのマージをサポートしています。必要に応じて、分割された PDF ファイルを 1 つのドキュメントに簡単に結合できます。

GroupDocs.Merger Cloud SDK for Python は、分割プロセス中に PDF ファイルの元の形式を保持しますか?

はい、SDK は PDF ファイルを複数のファイルに分割しながら、PDF ファイルの元の形式とレイアウトを維持します。

関連項目

関連トピックの詳細については、次の記事を参照することをお勧めします。