Java で Word 文書ページをオンラインで抽出する方法

ドキュメント ページの抽出 - Java で Word ファイルからページを抽出します。

Java で Word 文書から特定のページを抽出するのに苦労していますか?大規模な Word 文書 を操作する場合、大規模な Word 文書から特定のページを抽出するのは困難な作業となることがあります。幸いなことに、GroupDocs.Merger Cloud SDK for Java を使用すると、このプロセスが簡単になります。この記事では、GroupDocs.Merger Cloud SDK for Java を使用して Java で Word ファイルからページを抽出する方法を説明します。

この記事では次のトピックについて説明します。

Word ドキュメント ページを抽出するための Java REST API - SDK インストール

GroupDocs.Merger Cloud SDK for Java は、開発者がクラウド内のドキュメントとファイルをマージ、分割、並べ替え、抽出、操作できる強力な API です。ドキュメント ページとそのコンテンツを管理するための、簡単、信頼性、迅速な方法を提供します。 PDF、Word、Excel、HTML、PowerPoint など、最も一般的な ファイル形式 と互換性があります。この強力な SDK は使いやすく、Java ベースのアプリケーションに統合してファイル操作プロセスを自動化できます。

API の JAR ファイルを ダウンロード するか、Maven を使用して次のリポジトリと依存関係をプロジェクトの pom.xml ファイルに追加してインストールできます。

Maven リポジトリ:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven の依存関係:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

API キーを取得するには、GroupDocs Web サイトで無料トライアル アカウントにサインアップするか、サブスクリプション プランを購入する必要があります。クライアント ID とクライアント シークレットを取得したら、以下のコード スニペットを Java ベースのアプリケーションに追加します。

# 登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

正確なページ番号を使用して Java で Word ドキュメントからページを抽出する

環境をセットアップしたので、GroupDocs.Merger Cloud SDK for Java を使用して Word 文書からページを抽出する方法を見てみましょう。手順は次のとおりです。

ファイルをアップロードします

まず、以下のコード例を使用して、Word ドキュメントをクラウドにアップロードします。

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用してファイルを Cloud Storage にアップロードする
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

その結果、アップロードされた Word ファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Java で Word ドキュメントからページを抽出する

このセクションでは、GroupDocs.Merger Cloud SDK for Java を使用して Word 文書からページを抽出する方法の手順とサンプル コード スニペットについて説明します。

  • まず、必要なクラスを Java ファイルにインポートします。
  • 次に、PagesApi クラスのインスタンスを作成します。
  • 3 番目に、FileInfo クラスのインスタンスを作成します。
  • その後、ソース入力ファイルのパスを設定します。
  • 次に、ExtractOptions() クラスのインスタンスを作成します。
  • 次に、抽出オプションの setFileInfo、setOutputPath、および setPages コレクションを配列形式で定義します。
  • ここで、ExtractRequest() クラスのインスタンスを作成し、ExtractOptions パラメーターを渡します。
  • 最後に、PagesApi の extract() メソッドを呼び出して ExtractRequest パラメータを渡すことにより、DOCX ページを抽出します。

次のコード スニペットは、REST API を使用して Word ドキュメント ページを Java の新しいファイルに抽出する方法を示しています。

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// 正確なページ番号を使用して Java の Word 文書からページを抽出します。
public class App {

	public static void main(String[] args) {

		// Pages API のインスタンスを作成します。			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 設定を準備する
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 出力ファイルのパスを取得する
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

ファイルをダウンロード

上記のコード サンプルは、Word ドキュメントの抽出されたページをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用してクラウド ストレージからファイルをダウンロードする
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

ページ番号範囲を使用して Java で Word ファイルからページを抽出する

このセクションでは、正確なページ番号範囲に基づいて Word 文書から特定のページを抽出する方法の手順とサンプル コード スニペットを示します。

  • まず、必要なクラスを Java ファイルにインポートします。
  • 次に、PagesApi クラスのインスタンスを作成します。
  • 3番目に、FileInfoクラスのインスタンスを作成します。
  • その後、ソース入力ファイルのパスを設定します。
  • 次に、ExtractOptions() クラスのインスタンスを作成します。
  • 次に、抽出オプション setFileInfo、setOutputPath、setStartPageNumber、および setEndPageNumber を定義します。
  • 次に、ページ オプション setRangeMode を EVENPAGES に設定します。
  • ここで、ExtractRequest() クラスのインスタンスを作成し、ExtractOptions パラメーターを渡します。
  • 最後に、PagesApi の extract() メソッドを呼び出して ExtractRequest パラメーターを渡すことにより、ページを抽出します。

次のコード スニペットは、Java を使用してページ範囲とモードを適用して Word ファイル ページを抽出する方法を示しています。

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java でページ番号範囲を使用して Word ファイルからページを抽出します。
public class App {

	public static void main(String[] args) {
		
		// Pages API のインスタンスを作成します。
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 設定を準備する
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 出力ファイルのパスを取得する
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

無料のオンライン Word 文書抽出ツール

Word文書のページを無料で抽出するにはどうすればよいですか? Word 文書から特定のページを無料で抽出するには、オンライン Word ページ抽出ツール をお試しください。このオンライン Word ページ抽出ツールは、前述の Groupdocs.Merger Cloud API を使用して開発されています。

結論

結論として、GroupDocs.Merger Cloud SDK for Java は、開発者が Word 文書からオンラインでページを抽出するのに役立つ優れた選択肢です。この記事で学んだことは次のとおりです。

  • Java を使用して Word 文書からページ番号でページを抽出する方法。
  • Word 文書をプログラムでクラウド上にアップロードおよびダウンロードします。
  • 正確なページ番号範囲を使用して Java の Word DOCX ページを抽出します。
  • オンラインの Word ページ抽出ツールを使用して、Word から無料でページを抽出します。

さらに、ブラウザを通じて直接 API を視覚化し通信できるようにする API リファレンス セクション も提供しています。 Java SDK の完全なソース コードは Github で無料で入手できます。 Java 用 GroupDocs.Merger Cloud SDK 例はこちら を確認してください。

さらに、詳細な手順と API の使用方法については、スタート ガイド に従うことをお勧めします。

最後に、私たちは REST API を使用したさまざまなドキュメント操作に関する新しいブログ投稿を書き続けています。ですので、定期的に更新させていただきますので、お気軽にお問い合わせください。

質問する

文書ページの抽出方法についてご不明な点がございましたら、無料サポートフォーラムまでお気軽にお問い合わせください。

よくある質問

Java でオンラインで Word 文書からページを抽出するにはどうすればよいですか?

GroupDocs.Merger Cloud SDK for Java を使用して Word ファイルからページを抽出し、ワークフローを合理化できます。

REST APIを使用して特定のページを抽出できますか?

はい、GroupDocs.Merger Cloud SDK for Javaを使用して、配列形式でページ番号を指定して特定のページを抽出できます。

GroupDocs.Merger Cloud SDK for Java ではどのようなファイル形式がサポートされていますか?

GroupDocs.Merger Cloud SDK for Java は、Word、Excel、JPG、PowerPoint, PDF、HTML などを含む 幅広いファイル形式 をサポートしています。

GroupDocs.Merger Cloud SDK for Java を使用して Word ファイルから複数のページを抽出できますか?

はい、GroupDocs.Merger Cloud SDK for Java を使用して、抽出するページの範囲を指定することで、Word 文書から複数のページを抽出できます。

関連項目

役立つと思われる関連記事をいくつか紹介します。