
PDF(ポータブル ドキュメント フォーマット) は、オンラインで文書を共有および保存するために広く使用されているファイル形式です。テキスト、画像、表など、さまざまな種類のコンテンツを含むことがよくあります。信頼できるツールやライブラリがないと、画像などのPDFファイルから特定のコンテンツを抽出することは難しい作業です。そんなツールの一つが、Java用のGroupDocs.Parser Cloud SDKであり、PDFファイルから画像を抽出するためのシームレスで効率的な方法を提供します。この記事では、REST APIを使用してJavaでPDFファイルから画像を抽出する方法を示します。
この記事では以下のトピックが取り上げられます:
- Java REST APIを使用してPDFから画像を分離し、SDKをインストールする
- Java を使用して REST API で PDF ファイルからすべての画像を抽出する方法
- PDFファイルからページ番号を使用して特定の画像を抽出する
Java REST API to Separate Images from PDF and SDK Installation
GroupDocs.Parser Cloud SDK for Java は、さまざまな document formats からデータを解析および抽出するためのシンプルで効率的な方法を提供する、強力で多目的な Java ライブラリです。文書の解析のための幅広い機能を提供し、開発者が画像、テキスト、メタデータ、およびその他のコンテンツを抽出できるようにしています。GroupDocs.Parser は、Cloud API 用の document parser family members として C#.NET、Java、PHP、Ruby、および Python SDK も提供しています。
始めるには、JavaプロジェクトにGroupDocs.Parser Cloud SDKを含める必要があります。APIのJARファイルをダウンロードするか、次のリポジトリと依存関係をプロジェクトのpom.xmlファイルに追加してMavenを使用してインストールできます:
Maven リポジトリ:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven 依存関係:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
次に、sign upして無料トライアルアカウントを取得するか、purchase a subscription planをGroupDocsのウェブサイトで購入し、get your API keyを取得する必要があります。Client IdとClient Secretを取得したら、以下のコードスニペットをJavaベースのアプリケーションに追加します:
# 登録後、https://dashboard.groupdocs.cloud から clientid および clientsecret を取得してください。
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
PDFファイルから画像をREST APIを使用してJavaで抽出する方法
今、GroupDocs.Parser Cloud SDK for Javaを使用してPDFファイルから画像を抽出する手順と例のコードスニペットを記述しましょう:
- まず、必要なクラスをJavaファイルにインポートします。
- 次に、ParseApi クラスのインスタンスを作成します。
- 第三に、FileInfo クラスのインスタンスを作成します。
- 次に、入力PDFドキュメントへのパスを設定します。
- 次に、ImagesOptions() クラスのインスタンスを作成します。
- 次に、fileInfo を setFileInfo 画像オプションに割り当てます。
- 今、ImagesRequest() クラスのインスタンスを作成し、ImagesOptions パラメーターを渡します。
- 最後に、ParseApi.images() メソッドを呼び出し、ImagesRequest パラメーターを渡して結果を取得します。
次のコードサンプルは、REST APIを使用してJavaでオンラインのPDFファイルからすべての画像を抽出する方法を示しています:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// PDFファイルから画像をJavaで抽出する方法。
public class App {
public static void main(String[] args) {
// Parse APIのインスタンスを作成する
ParseApi apiInstance = new ParseApi(configuration);
try {
// 設定を準備してください。
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// 出力ファイルのパスを取得する
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
PDFファイルからページ番号を使用して特定の画像を抽出する
このセクションでは、Javaでプログラム的にPDFファイルから特定の画像を抽出するための手順とコードスニペットを提供します:
- まず、必要なクラスをJavaファイルにインポートします。
- 次に、ParseApi クラスのインスタンスを作成します。
- 第三に、FileInfo クラスのインスタンスを作成します。
- 次に、入力PDFドキュメントへのパスを設定します。
- 次に、ImagesOptions() クラスのインスタンスを作成します。
- 次に、fileInfo を setFileInfo 画像オプションに割り当てます。
- その後、setStartPageNumber と setCountPagesToExtract の値を提供してください。
- 今、ImagesRequest() クラスのインスタンスを作成し、ImagesOptions パラメーターを渡します。
- 最後に、ParseApi.images() メソッドを呼び出し、ImagesRequest パラメータを渡して結果を取得します。
次のコードサンプルは、REST APIを使用してJavaでページ範囲ごとにPDFファイルから特定の画像を抽出する方法を示しています。
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// PDF ファイルからページ範囲でオンラインで画像を抽出する方法を Java で説明します。
public class App {
public static void main(String[] args) {
// Parse APIのインスタンスを作成する
ParseApi apiInstance = new ParseApi(configuration);
try {
// 設定を準備します。
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// 出力ファイルのパスを取得する
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
無料オンライン画像抽出器
PDFから画像を無料でオンラインで抽出する最良の方法は何ですか? PDFファイルから画像を抽出するために、オンライン PDF File parserを試してください。このPDF Parserソフトウェアは、上記のパーサーライブラリを使用してJavaで開発されています。
結論
結論として、GroupDocs.Parser Cloud SDK for Javaは、PDFファイルから画像を簡単に抽出するための信頼性が高く効率的なソリューションを提供します。以下は、この記事から学んだことです:
- How to extract all images from PDF files programmatically in Java using REST API;
- PDFドキュメントから特定の画像を抽出する方法をJavaを使用してREST APIを介して行います;
- PDF文書から画像を抽出するためのオンライン画像抽出ツール。
さらに、documentationを使用してGroupDocs.Parser Cloud APIについて詳しく学ぶことができます。また、ブラウザを通じてAPIを直接視覚化し、対話できるAPI Referenceセクションも提供しています。Java SDKの完全なソースコードはGithubで自由に入手可能です。
Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.
質問をしてください
文書の解析方法について何かご質問がある場合は、forumを通じてお気軽にお問い合わせください。
FAQs
How do I parse PDF files using Java?
画像、テキスト、またはメタデータを抽出するには、まず GroupDocs.Parser Cloud SDK を使用して PDF ドキュメントを読み込み、解析する必要があります。このプロセスでは、ファイルパスを指定し、Parse メソッドを呼び出して PDF ファイルを解析します。
GroupDocs.Parser Cloud SDK for Javaは、PDF以外のファイル形式をサポートしていますか?
はい、PDFファイルに加えて、 GroupDocs.Parser Cloud SDK for Java は、Word、Excel、PowerPoint, HTMLなど、さまざまなドキュメント形式からの画像の抽出をサポートしています。
Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?
はい、GroupDocs.Parser Cloud SDK for Javaを使用してPDFファイルからすべての画像を抽出できます。
See Also
ここにあなたが役に立つかもしれない関連する記事があります: