
PDF(可攜式文件格式) 是一種廣泛使用的文件格式,用於在線分享和保存文檔。它通常包含各種類型的內容,包括文本、圖像、表格等。從 PDF 文件中提取特定內容,例如圖像,可能是一項具有挑戰性的任務,特別是在沒有可靠工具或庫的情況下。其中一個工具是 GroupDocs.Parser Cloud SDK for Java,它提供了一種無縫且高效的方式來從 PDF 文件中提取圖像。在本文章中,我們將演示如何使用 REST API 在 Java 中從 PDF 文件中提取圖像。
本文章將涵蓋以下主題:
Java REST API to Separate Images from PDF and SDK Installation
GroupDocs.Parser Cloud SDK for Java 是一個強大而多功能的 Java 庫,提供了一種簡單有效的方法來解析和提取各種 document formats 的數據,包括 PDF 文件。它提供了廣泛的文檔解析功能,允許開發者提取圖像、文本、元數據和其他內容。GroupDocs.Parser 也為 Cloud API 提供 C#.NET、Java、PHP、Ruby 和 Python SDK 作為其 document parser family members。
要開始使用,您需要在您的 Java 專案中包含 GroupDocs.Parser Cloud SDK。您可以選擇 下載 API 的 JAR 檔案,或通過將以下儲存庫和依賴項添加到您專案的 pom.xml 檔案中,使用 Maven 安裝它:
Maven 倉庫:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven 依賴:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
接下來,您需要 sign up 以獲得免費試用帳戶或 purchase a subscription plan 在 GroupDocs 網站上,然後 get your API key。一旦您擁有客戶 ID 和客戶密鑰,請將以下代碼片段添加到基於 Java 的應用程序中:
# Get your clientid and clientsecret from https://dashboard.groupdocs.cloud after registration.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
如何使用 REST API 在 Java 中提取 PDF 文件中的所有圖像
現在,讓我們寫下使用 GroupDocs.Parser Cloud SDK for Java 從 PDF 文件中提取圖像的步驟和示例代碼片段:
- 首先,將所需的類導入到您的 Java 文件中。
- 其次,創建 ParseApi 類的實例。
- 第三,創建 FileInfo 類的實例。
- 接下來,設置輸入 PDF 文件的路徑。
- 然後,創建 ImagesOptions() 類的實例。
- 接下來,將 fileInfo 指派給 setFileInfo 圖像選項。
- 現在,創建一個 ImagesRequest() 類的實例並傳遞 ImagesOptions 參數。
- 最後,通過調用 ParseApi.images() 方法並傳遞 ImagesRequest 參數來獲取結果。
以下代碼範例顯示如何在線上使用 REST API 在 Java 中從 PDF 文件中提取所有圖像:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// 如何在 Java 中從 PDF 文件中提取圖片。
public class App {
public static void main(String[] args) {
// 創建 Parse API 的實例
ParseApi apiInstance = new ParseApi(configuration);
try {
// 準備設置
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// 獲取輸出文件路徑
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
提取特定圖片從 PDF 檔案中在 Java 中使用頁碼
在本節中,我們將提供步驟和代碼片段,以便在 Java 中以程序方式從 PDF 文件中提取特定圖像:
- 首先,將所需的類導入到您的 Java 文件中。
- 其次,創建一個 ParseApi 類的實例。
- 第三,創建一個 FileInfo 類的實例。
- 接下來,設置輸入 PDF 文件的路徑。
- 然後,創建 ImagesOptions() 類的實例。
- 接下來,將 fileInfo 指派給 setFileInfo 圖像選項。
- 然後,提供 setStartPageNumber 和 setCountPagesToExtract 的值。
- 現在,創建一個 ImagesRequest() 類的實例並傳遞 ImagesOptions 參數。
- Lastly, get results by calling the ParseApi.images() method and passing the ImagesRequest parameter.
以下代碼示例顯示如何在 Java 中使用 REST API 根據頁面範圍從 PDF 文件中提取特定圖像:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// 從PDF文件中按頁面範圍提取圖像在線,使用Java。
public class App {
public static void main(String[] args) {
// 創建 Parse API 的實例
ParseApi apiInstance = new ParseApi(configuration);
try {
// 準備設置
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// 取得輸出檔案路徑
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
免費線上圖片提取器
從PDF中免費在線提取圖像的最佳方法是什麼?請嘗試使用 online PDF File parser 來從PDF文件中提取圖像。這款PDF解析器軟件是使用上面提到的Java解析器庫開發的。
結論
總結來說,GroupDocs.Parser Cloud SDK for Java 提供了一個可靠且高效的解決方案,便於從 PDF 檔案中提取圖像。以下是您從這篇文章中學到的內容:
- 如何使用 REST API 以程式化方式在 Java 中從 PDF 文件中提取所有圖片;
- 如何使用 REST API 在 Java 中從 PDF 文檔中提取特定圖像;
- 在線圖像提取工具,用於從 PDF 文件中提取圖像。
此外,您可以透過 documentation 瞭解更多有關 GroupDocs.Parser Cloud API 的信息。我們還提供一個 API Reference 部分,讓您可以通過瀏覽器直接視覺化和互動我們的 API。Java SDK 的完整源代碼可在 Github 上免費獲取。
Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.
Ask a question
如果您對如何解析文檔有任何疑問,請隨時通過我們的 forum 聯繫我們。
常見問題解答
How do I parse PDF files using Java?
要提取圖像、文本或元數據,您首先需要使用 GroupDocs.Parser Cloud SDK 加載和解析 PDF 文件。此過程涉及指定文件路徑並調用 Parse 方法來解析 PDF 文件。
GroupDocs.Parser Cloud SDK for Java 是否支持除 PDF 以外的其他文件格式?
是的,除了 PDF 文件,GroupDocs.Parser Cloud SDK for Java 還支持從各種文檔格式中提取圖像,包括 Word、Excel、PowerPoint, HTML 等等。
Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?
是的,您可以使用 GroupDocs.Parser Cloud SDK for Java 從 PDF 文件中提取所有圖像。
參見
以下是一些您可能會覺得有幫助的相關文章: