Java で DOCX ページを抽出する |単語抽出ツール

Java で Word 文書ページをオンラインで抽出する方法 — ドキュメントページの抽出 - Java で Word ファイルからページを抽出します。

Java で Word 文書から特定のページを抽出するのに苦労していますか?大規模な Word 文書を操作する場合、大規模な Word 文書から特定のページを抽出するのは困難な作業となることがあります。幸いなことに、GroupDocs.Merger Cloud SDK for Java を使用すると、このプロセスが簡単になります。この記事では、GroupDocs.Merger Cloud SDK for Java を使用して Java で Word ファイルからページを抽出する方法を説明します。

この記事では次のトピックについて説明します。

Word ドキュメントページを抽出するための Java REST API - SDK のインストール
正確なページ番号を使用して Java で Word 文書からページを抽出する
ページ番号範囲を使用して Java で Word ファイルからページを抽出する

Word ドキュメントページを抽出するための Java REST API - SDK インストール

GroupDocs.Merger Cloud SDK for Java は、開発者がクラウド内のドキュメントとファイルをマージ、分割、並べ替え、抽出、操作できる強力な API です。ドキュメントページとそのコンテンツを管理するための、簡単、信頼性、迅速な方法を提供します。 PDF、Word、Excel、HTML、PowerPoint など、最も一般的なファイル形式と互換性があります。この強力な SDK は使いやすく、Java ベースのアプリケーションに統合してファイル操作プロセスを自動化できます。

API の JAR ファイルをダウンロードするか、Maven を使用して次のリポジトリと依存関係をプロジェクトの pom.xml ファイルに追加してインストールできます。

Maven リポジトリ:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven の依存関係:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

API キーを取得するには、GroupDocs Web サイトで無料トライアルアカウントにサインアップするか、サブスクリプションプランを購入する必要があります。クライアント ID とクライアントシークレットを取得したら、以下のコードスニペットを Java ベースのアプリケーションに追加します。

# 登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

正確なページ番号を使用して Java で Word ドキュメントからページを抽出する

環境をセットアップしたので、GroupDocs.Merger Cloud SDK for Java を使用して Word 文書からページを抽出する方法を見てみましょう。手順は次のとおりです。

Wordファイルをクラウドにアップロード
抜粋 Java のオンライン Word ページ
Word文書をダウンロード

ファイルをアップロードします

まず、以下のコード例を使用して、Word ドキュメントをクラウドにアップロードします。

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用してファイルを Cloud Storage にアップロードする
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

その結果、アップロードされた Word ファイルは、クラウド上のダッシュボードのファイルセクションで利用できるようになります。

Java で Word ドキュメントからページを抽出する

このセクションでは、GroupDocs.Merger Cloud SDK for Java を使用して Word 文書からページを抽出する方法の手順とサンプルコードスニペットについて説明します。

まず、必要なクラスを Java ファイルにインポートします。
次に、PagesApi クラスのインスタンスを作成します。
3 番目に、FileInfo クラスのインスタンスを作成します。
その後、ソース入力ファイルのパスを設定します。
次に、ExtractOptions() クラスのインスタンスを作成します。
次に、抽出オプションの setFileInfo、setOutputPath、および setPages コレクションを配列形式で定義します。
ここで、ExtractRequest() クラスのインスタンスを作成し、ExtractOptions パラメーターを渡します。
最後に、PagesApi の extract() メソッドを呼び出して ExtractRequest パラメータを渡すことにより、DOCX ページを抽出します。

次のコードスニペットは、REST API を使用して Word ドキュメントページを Java の新しいファイルに抽出する方法を示しています。

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// 正確なページ番号を使用して Java の Word 文書からページを抽出します。
public class App {

	public static void main(String[] args) {

		// Pages API のインスタンスを作成します。			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 設定を準備する
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 出力ファイルのパスを取得する
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

ファイルをダウンロード

上記のコードサンプルは、Word ドキュメントの抽出されたページをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java を使用してクラウド ストレージからファイルをダウンロードする
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

ページ番号範囲を使用して Java で Word ファイルからページを抽出する

このセクションでは、正確なページ番号範囲に基づいて Word 文書から特定のページを抽出する方法の手順とサンプルコードスニペットを示します。

まず、必要なクラスを Java ファイルにインポートします。
次に、PagesApi クラスのインスタンスを作成します。
3番目に、FileInfoクラスのインスタンスを作成します。
その後、ソース入力ファイルのパスを設定します。
次に、ExtractOptions() クラスのインスタンスを作成します。
次に、抽出オプション setFileInfo、setOutputPath、setStartPageNumber、および setEndPageNumber を定義します。
次に、ページオプション setRangeMode を EVENPAGES に設定します。
ここで、ExtractRequest() クラスのインスタンスを作成し、ExtractOptions パラメーターを渡します。
最後に、PagesApi の extract() メソッドを呼び出して ExtractRequest パラメーターを渡すことにより、ページを抽出します。

次のコードスニペットは、Java を使用してページ範囲とモードを適用して Word ファイルページを抽出する方法を示しています。

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Java でページ番号範囲を使用して Word ファイルからページを抽出します。
public class App {

	public static void main(String[] args) {
		
		// Pages API のインスタンスを作成します。
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// 設定を準備する
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// 出力ファイルのパスを取得する
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

無料のオンライン Word 文書抽出ツール

Word文書のページを無料で抽出するにはどうすればよいですか? Word 文書から特定のページを無料で抽出するには、オンライン Word ページ抽出ツールをお試しください。このオンライン Word ページ抽出ツールは、前述の Groupdocs.Merger Cloud API を使用して開発されています。

結論

結論として、GroupDocs.Merger Cloud SDK for Java は、開発者が Word 文書からオンラインでページを抽出するのに役立つ優れた選択肢です。この記事で学んだことは次のとおりです。

Java を使用して Word 文書からページ番号でページを抽出する方法。
Word 文書をプログラムでクラウド上にアップロードおよびダウンロードします。
正確なページ番号範囲を使用して Java の Word DOCX ページを抽出します。
オンラインの Word ページ抽出ツールを使用して、Word から無料でページを抽出します。

さらに、ブラウザを通じて直接 API を視覚化し通信できるようにする API リファレンスセクションも提供しています。 Java SDK の完全なソースコードは Github で無料で入手できます。 Java 用 GroupDocs.Merger Cloud SDK 例はこちらを確認してください。

さらに、詳細な手順と API の使用方法については、スタートガイドに従うことをお勧めします。

最後に、私たちは REST API を使用したさまざまなドキュメント操作に関する新しいブログ投稿を書き続けています。ですので、定期的に更新させていただきますので、お気軽にお問い合わせください。

質問する

文書ページの抽出方法についてご不明な点がございましたら、無料サポートフォーラムまでお気軽にお問い合わせください。

よくある質問

Java でオンラインで Word 文書からページを抽出するにはどうすればよいですか?

GroupDocs.Merger Cloud SDK for Java を使用して Word ファイルからページを抽出し、ワークフローを合理化できます。

REST APIを使用して特定のページを抽出できますか?

はい、GroupDocs.Merger Cloud SDK for Javaを使用して、配列形式でページ番号を指定して特定のページを抽出できます。

GroupDocs.Merger Cloud SDK for Java ではどのようなファイル形式がサポートされていますか?

GroupDocs.Merger Cloud SDK for Java は、Word、Excel、JPG、PowerPoint, PDF、HTML などを含む幅広いファイル形式をサポートしています。

GroupDocs.Merger Cloud SDK for Java を使用して Word ファイルから複数のページを抽出できますか?

はい、GroupDocs.Merger Cloud SDK for Java を使用して、抽出するページの範囲を指定することで、Word 文書から複数のページを抽出できます。

文書ページの抽出 - Java で Word ファイルからページを抽出

Word ドキュメントページを抽出するための Java REST API - SDK インストール

正確なページ番号を使用して Java で Word ドキュメントからページを抽出する

ファイルをアップロードします

Java で Word ドキュメントからページを抽出する

ファイルをダウンロード

ページ番号範囲を使用して Java で Word ファイルからページを抽出する

無料のオンライン Word 文書抽出ツール

結論

質問する

よくある質問

関連項目

Word ドキュメント ページを抽出するための Java REST API - SDK インストール#

正確なページ番号を使用して Java で Word ドキュメントからページを抽出する#

ファイルをアップロードします#

Java で Word ドキュメントからページを抽出する#

ファイルをダウンロード#

ページ番号範囲を使用して Java で Word ファイルからページを抽出する#

無料のオンライン Word 文書抽出ツール#

結論#

質問する#

よくある質問#

関連項目#

Word ドキュメントページを抽出するための Java REST API - SDK インストール

正確なページ番号を使用して Java で Word ドキュメントからページを抽出する

ファイルをアップロードします

Java で Word ドキュメントからページを抽出する

ファイルをダウンロード

ページ番号範囲を使用して Java で Word ファイルからページを抽出する

無料のオンライン Word 文書抽出ツール

結論

質問する

よくある質問

関連項目