JavaでPDFページを抽出する方法

Java で PDF からページを抽出 - オンラインで PDF ページを分離します。

PDF ファイルを使用している場合、PDF ファイルからページを抽出する必要がある場合があります。 PDF ファイルからページを抽出するのは、特に手動で行う必要がある場合や大きな文書を扱う場合には、時間のかかる作業になる可能性があります。幸いなことに、GroupDocs.Merger Cloud SDK for Java を利用すると、プログラムで PDF ファイルからページを簡単に抽出できます。この記事では、Java で PDF からページを抽出する方法を説明します。

この記事では次のトピックについて説明します。

Java PDF Pages Extractor REST API および SDK のインストール

GroupDocs.Merger Cloud SDK for Java は、開発者がファイルや 他のタイプのドキュメント(Word、Excel など) からページをマージ、抽出、分割、並べ替え、削除できるクラウドベースの API です。 、PowerPoint, HTML、PDF など。この強力な SDK は使いやすく、Java ベースのアプリケーションに統合してファイル操作タスクを自動化できます。

API の JAR ファイルを ダウンロード することも、Maven を使用して次のリポジトリと依存関係をプロジェクトの pom.xml ファイルに追加してインストールすることもできます。

Maven リポジトリ:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven の依存関係:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

次に、GroupDocs Web サイトで無料トライアル アカウントに サインアップするか、サブスクリプション プランを購入して API キーを取得する必要があります。クライアント ID とクライアント シークレットを取得したら、以下のコード スニペットを Java ベースのアプリケーションに追加します。

# 登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Java で正確なページ番号で PDF ページを抽出する方法

GroupDocs.Merger Cloud SDK for Java を使用して PDF ファイルからページを抽出するには、次の手順に従う必要があります。

ファイルをアップロードします

まず、以下のコード例を使用して、PDF ファイルをクラウドにアップロードします。

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用してファイルを Cloud Storage にアップロードする
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

その結果、アップロードされた PDF ファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Java で PDF ファイルからページを抽出する

GroupDocs.Merger Cloud SDK for Java を使用して PDF ファイルからページを抽出する方法に関するステップバイステップ ガイドとサンプル コード スニペットを次に示します。

  • まず、必要なクラスを Java ファイルにインポートします。
  • 次に、PagesApi クラスのインスタンスを作成します。
  • 3 番目に、FileInfo クラスのインスタンスを作成します。
  • その後、ソース入力ファイルのパスを設定します。
  • 次に、ExtractOptions() クラスのインスタンスを作成します。
  • 次に、抽出オプションの setFileInfo、setOutputPath、および setPages コレクションを配列形式で定義します。
  • 次に、ExtractRequest() クラスのインスタンスを作成し、ExtractOptions パラメーターを渡します。
  • 最後に、PagesApi の extract() メソッドを呼び出して ExtractRequest パラメーターを渡すことにより、ページを抽出します。

次のコード スニペットは、REST API を使用して Java で PDF ファイルを個々のページに分割する方法を示しています。

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java で正確なページ番号を使用して PDF ページを抽出する方法。
public class App {

	public static void main(String[] args) {

		// Pages API のインスタンスを作成します。			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 設定を準備する
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 出力ファイルのパスを取得する
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

ファイルをダウンロード

上記のコード サンプルは、PDF の特定のページをクラウドに保存します。次のコードサンプルを使用してダウンロードできます。

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用してクラウド ストレージからファイルをダウンロードする
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Java を使用して PDF からページ範囲ごとにページを抽出する方法

このセクションでは、ページ範囲を適用して Java を使用して PDF から選択したページを保存するためのステップバイステップのガイドとコード スニペットの例について説明します。

  • まず、必要なクラスを Java ファイルにインポートします。
  • 次に、PagesApi クラスのインスタンスを作成します。
  • 3番目に、FileInfoクラスのインスタンスを作成します。
  • その後、ソース入力ファイルのパスを設定します。
  • 次に、ExtractOptions() クラスのインスタンスを作成します。
  • 次に、抽出オプション setFileInfo、setOutputPath、setStartPageNumber、および setEndPageNumber を定義します。
  • 次に、ページ オプション setRangeMode を EVENPAGES に設定します。
  • 次に、ExtractRequest() クラスのインスタンスを作成し、ExtractOptions パラメーターを渡します。
  • 最後に、PagesApi の extract() メソッドを呼び出して ExtractRequest パラメーターを渡すことにより、ページを抽出します。

次のコード スニペットは、Java でページ範囲とモードを適用して PDF ページを抽出する方法を示しています。

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用して PDF からページ範囲ごとにページを抽出する方法。
public class App {

	public static void main(String[] args) {
		
		// Pages API のインスタンスを作成します。		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 設定を準備する
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 出力ファイルのパスを取得する
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

無料のオンライン PDF ページ抽出ツール

PDFページを無料で抽出するにはどうすればよいですか? PDF から特定のページを無料で抽出するには、無料 PDF ページ抽出ツール をお試しください。このオンライン PDF ページ抽出ツールは、前述の Groupdocs.Merger Cloud API を使用して開発されています。

結論

GroupDocs.Merger Cloud SDK for Java は、Java で PDF ページを新しい PDF に抽出する簡単な方法を提供します。この記事で学んだことは次のとおりです。

  • Java を使用して PDF ファイルを番号ごとに複数のページに分割する方法。
  • クラウド上で Java を使用してプログラムで PDF ファイルをアップロードおよびダウンロードします。
  • ページ範囲を使用して Java で PDF を個々のページに分割します。
  • オンラインで無料の PDF ページ抽出ツールを使用して、PDF からページをオンラインで無料で抽出します。

さらに、ブラウザを通じて直接 API を視覚化し通信できるようにする API リファレンス セクション も提供しています。 Java SDK の完全なソース コードは Github で無料で入手できます。 Java 用 GroupDocs.Merger Cloud SDK 例はこちら を確認してください。

さらに、詳細な手順と API の使用法については、スタート ガイド に従うことをお勧めします。

最後に、私たちは REST API を使用したさまざまなドキュメント操作に関する新しいブログ投稿を書き続けています。ですので、定期的に更新させていただきますので、お気軽にお問い合わせください。

質問する

PDF ページ抽出 API についてご質問がある場合は、無料サポート フォーラムでお気軽にお問い合わせください。

よくある質問

Java で PDF ファイルからページを抽出するにはどうすればよいですか?

GroupDocs.Merger Cloud SDK for Java を使用して PDF ファイルからページを抽出できます。

JavaでPDFから単一ページをエクスポートすることは可能ですか?

はい、GroupDocs.Merger Cloud SDK for Java を使用すると、Java でプログラム的に PDF ページを単一ファイルに抽出できます。

GroupDocs.Merger Cloud SDK for Java を使用してページを抽出できるファイル形式は何ですか?

Java 用 GroupDocs.Merger Cloud SDK は、PDF ファイルに加えて、Microsoft Word、Excel、PowerPoint, HTML、および その他のファイル形式 からページを抽出できます。

関連項目

役立つと思われる関連記事をいくつか紹介します。