Java在線提取Word文檔頁面的方法

提取文檔頁面 - 從 Java 中的 Word 文件中提取頁面。

您是否正在努力從 Java 中的 Word 文檔中提取特定頁面?在處理大型 Word 文檔 時,從大型 Word 文檔中提取特定頁面可能是一項具有挑戰性的任務。幸運的是,適用於 Java 的 GroupDocs.Merger Cloud SDK 可幫助您簡化此過程。在本文中,我們將探討如何使用 GroupDocs.Merger Cloud SDK for Java 從 Java 中的 Word 文件中提取頁面。

本文應涵蓋以下主題:

用於提取 Word 文檔頁面的 Java REST API - SDK 安裝

GroupDocs.Merger Cloud SDK for Java 是一個強大的 API,允許開發人員合併、拆分、重新排序、提取和操作雲中的文檔和文件。它提供了一種簡單、可靠且快速的方式來管理文檔頁面及其內容。它兼容大多數流行的文件格式,例如 PDF、Word、Excel、HTML、PowerPoint 等。這個功能強大的 SDK 易於使用,可以集成到基於 Java 的應用程序中以自動執行文件操作過程。

您可以 下載 API 的 JAR 文件或使用 Maven 安裝它,方法是將以下存儲庫和依賴項添加到項目的 pom.xml 文件中:

Maven 存儲庫:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven 依賴項:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

現在,您必須在 GroupDocs 網站上註冊 免費試用帳戶或購買訂閱計劃 才能獲取您的 API 密鑰。獲得客戶端 ID 和客戶端密碼後,將以下代碼片段添加到基於 Java 的應用程序中:

# 註冊後從 https://dashboard.groupdocs.cloud 獲取你的 client_id 和 client_secret。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

使用精確頁碼從 Java 中的 Word 文檔中提取頁面

現在我們已經設置了環境,讓我們看看如何使用 GroupDocs.Merger Cloud SDK for Java 從 Word 文檔中提取頁面。以下是步驟:

上傳文件

首先,使用下面給出的代碼示例將Word文檔上傳到雲端:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// 使用Java上傳文件到雲存儲
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

因此,上傳的 Word 文件將在雲上儀表板的 文件部分 中可用。

從 Java 中的 Word 文檔中提取頁面

在本節中,我們將介紹有關如何使用 GroupDocs.Merger Cloud SDK for Java 從 Word 文檔中提取頁面的步驟和示例代碼片段:

  • 首先,將所需的類導入到您的 Java 文件中。
  • 其次,創建 PagesApi 類的一個實例。
  • 第三,創建 FileInfo 類的一個實例。
  • 之後,設置源輸入文件路徑。
  • 現在,創建 ExtractOptions() 類的一個實例。
  • 然後,以數組格式定義提取選項 setFileInfo、setOutputPath 和 setPages 集合。
  • 現在,創建 ExtractRequest() 類的實例並傳遞 ExtractOptions 參數。
  • 最後,通過調用 PagesApi 的 extract() 方法並傳遞 ExtractRequest 參數來提取 DOCX 頁面。

以下代碼片段顯示瞭如何使用 REST API 將 Word 文檔頁面提取到 Java 中的新文件中:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// 使用準確的頁碼從 Java 中的 word 文檔中提取頁面。
public class App {

	public static void main(String[] args) {

		// 創建頁面 API 的實例。			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 準備設置
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 獲取輸出文件路徑
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

下載文件

上面的代碼示例會將提取的 Word 文檔頁面保存在雲端。您可以使用以下代碼示例下載它:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// 使用 Java 從雲存儲下載文件
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

使用頁碼範圍從 Java 中的 Word 文件中提取頁面

在本節中,我們將提供有關如何按確切頁碼範圍從 Word 文檔中提取特定頁面的步驟和示例代碼片段:

  • 首先,將所需的類導入到您的 Java 文件中。
  • 其次,創建 PagesApi 類的實例。
  • 第三,創建 FileInfo 類的一個實例。
  • 之後,設置源輸入文件路徑。
  • 現在,創建 ExtractOptions() 類的一個實例。
  • 然後,定義提取選項 setFileInfo、setOutputPath、setStartPageNumber 和 setEndPageNumber。
  • 接下來,將頁面選項 setRangeMode 設置為 EVENPAGES。
  • 現在,創建 ExtractRequest() 類的實例並傳遞 ExtractOptions 參數。
  • 最後,通過調用 PagesApi 的 extract() 方法並傳遞 ExtractRequest 參數來提取頁面。

以下代碼片段顯示瞭如何使用 Java 通過應用頁面範圍和模式來提取 Word 文件頁面:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// 使用頁碼範圍從 Java 中的 Word 文件中提取頁面。
public class App {

	public static void main(String[] args) {
		
		// 創建頁面 API 的實例。
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 準備設置
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 獲取輸出文件路徑
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

免費在線 Word 文檔提取器

如何免費提取Word文檔頁面?請嘗試使用在線 Word 頁面提取器 從 Word 文檔中免費提取特定頁面。這個在線 Word 頁面提取器工具是使用上述 Groupdocs.Merger Cloud API 開發的。

結論

總之,GroupDocs.Merger Cloud SDK for Java 是一個很好的選擇,可以幫助開發人員在線從 Word 文檔中提取頁面。以下是您在本文中學到的內容:

  • 如何使用 Java 按頁碼從 Word 文檔中提取頁面;
  • 以編程方式上傳和下載雲端的Word文檔;
  • 使用精確的頁碼範圍提取 Java 中的 Word DOCX 頁面;
  • 並使用在線 Word 頁面提取工具免費從 Word 中提取頁面。

此外,我們還提供了一個 API 參考部分,可讓您直接通過瀏覽器可視化我們的 API 並與之通信。 Java SDK 的完整源代碼可在 Github 上免費獲得。請查看 GroupDocs.Merger Cloud SDK for Java 此處示例

此外,我們建議您按照我們的 入門指南 了解詳細步驟和 API 用法。

最後,我們不斷撰寫有關使用 REST API 的不同文檔操作的新博文。因此,請與我們聯繫以獲取定期更新。

問一個問題

如果您對如何提取文檔頁面有任何疑問,請隨時在免費支持論壇 上向我們提問。

常見問題

如何使用 Java 在線從 Word 文檔中提取頁面?

您可以使用 GroupDocs.Merger Cloud SDK for Java 從 Word 文件中提取頁面並簡化您的工作流程。

我可以使用 REST API 提取特定頁面嗎?

是的,您可以使用 GroupDocs.Merger Cloud SDK for Java 以數組格式指定頁碼以提取特定頁面。

GroupDocs.Merger Cloud SDK for Java 支持哪些文件格式?

GroupDocs.Merger Cloud SDK for Java 支持廣泛的文件格式,包括 Word、Excel、JPG、PowerPoint, PDF、HTML 等。

我可以使用 GroupDocs.Merger Cloud SDK for Java 從 Word 文件中提取多個頁面嗎?

是的,您可以使用 GroupDocs.Merger Cloud SDK for Java 通過指定要提取的頁面範圍從 Word 文檔中提取多個頁面。

也可以看看

以下是一些您可能會覺得有用的相關文章: