Cara mengekstrak halaman dokumen Word online di Java

Ekstrak Halaman Dokumen - Ekstrak Halaman dari File Word di Java.

Apakah Anda kesulitan mengekstrak halaman tertentu dari dokumen Word di Java? Saat bekerja dengan [dokumen Word] besar 1, itu bisa menjadi tugas yang menantang untuk mengekstrak halaman tertentu dari dokumen Word besar. Untungnya, SDK Cloud GroupDocs.Merger untuk Java membantu Anda mempermudah proses ini. Pada artikel ini, kita akan mempelajari cara mengekstrak halaman dari file Word di Java menggunakan GroupDocs.Merger Cloud SDK for Java.

Topik-topik berikut akan dibahas dalam artikel ini:

Java REST API untuk Mengekstrak Halaman Dokumen Word - Instalasi SDK

GroupDocs.Merger Cloud SDK for Java adalah API andal yang memungkinkan developer untuk menggabungkan, membagi, menyusun ulang, mengekstrak, dan memanipulasi dokumen dan file di cloud. Ini memberikan cara yang mudah, andal, dan cepat untuk mengelola halaman dokumen dan kontennya. Ini kompatibel dengan [format file] paling populer 5 seperti PDF, Word, Excel, HTML, PowerPoint, dan banyak lagi. SDK yang kuat ini mudah digunakan dan dapat diintegrasikan ke dalam aplikasi berbasis Java untuk mengotomatiskan proses manipulasi file.

Anda dapat mengunduh file JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan ketergantungan berikut ke dalam file pom.xml proyek Anda:

Repositori Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Ketergantungan Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Sekarang, Anda harus mendaftar untuk mendapatkan akun uji coba gratis atau membeli paket langganan di situs web GroupDocs untuk mendapatkan kunci API Anda. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:

# Dapatkan client_id dan client_secret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Ekstrak Halaman dari Dokumen Word di Java menggunakan Exact Page Numbers

Sekarang kita telah menyiapkan lingkungan kita, mari kita lihat bagaimana menggunakan SDK Cloud GroupDocs.Merger untuk Java untuk mengekstrak halaman dari dokumen Word. Berikut langkah-langkahnya:

Unggah Berkas

Pertama, unggah dokumen Word ke cloud menggunakan contoh kode yang diberikan di bawah ini:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Unggah file ke Cloud Storage menggunakan Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Hasilnya, file Word yang diunggah akan tersedia di bagian file dasbor Anda di cloud.

Ekstrak Halaman dari Dokumen Word di Java

Di bagian ini, kami akan membahas langkah-langkah dan cuplikan kode contoh tentang cara mengekstrak halaman dari dokumen Word menggunakan GroupDocs.Merger Cloud SDK untuk Java:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas PagesApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Setelah itu, atur jalur file input sumber.
  • Sekarang, buat sebuah instance dari kelas ExtractOptions().
  • Kemudian, tentukan opsi ekstrak setFileInfo, setOutputPath, dan koleksi setPages dalam format array.
  • Sekarang, buat instance dari kelas ExtractRequest() dan berikan parameter ExtractOptions.
  • Terakhir, ekstrak halaman DOCX dengan memanggil metode extract() dari PagesApi dan meneruskan parameter ExtractRequest.

Cuplikan kode berikut menunjukkan cara mengekstrak halaman dokumen Word menjadi file baru di Java menggunakan REST API:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Ekstrak halaman dari dokumen kata di Java menggunakan nomor halaman yang tepat.
public class App {

	public static void main(String[] args) {

		// Buat instance API Halaman.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Unduh File

Contoh kode di atas akan menyimpan halaman dokumen Word yang diekstraksi di cloud. Anda dapat mengunduhnya menggunakan contoh kode berikut:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Unduh File dari Cloud Storage menggunakan Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Ekstrak Halaman dari Berkas Word di Java menggunakan Kisaran Nomor Halaman

Di bagian ini, kami akan memberikan langkah-langkah dan cuplikan kode contoh tentang cara mengekstrak halaman tertentu dari dokumen Word dengan rentang nomor halaman yang tepat:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas PagesApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Setelah itu, atur jalur file input sumber.
  • Sekarang, buat sebuah instance dari kelas ExtractOptions().
  • Kemudian, tentukan opsi ekstrak setFileInfo, setOutputPath, setStartPageNumber, dan setEndPageNumber.
  • Selanjutnya, setel opsi halaman setRangeMode ke EVENPAGES.
  • Sekarang, buat instance dari kelas ExtractRequest() dan berikan parameter ExtractOptions.
  • Terakhir, ekstrak halaman dengan memanggil metode extract() dari PagesApi dan meneruskan parameter ExtractRequest.

Cuplikan kode berikut menunjukkan cara mengekstrak halaman file Word dengan menerapkan rentang dan mode halaman menggunakan Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Ekstrak halaman dari file Word di Java menggunakan rentang nomor halaman.
public class App {

	public static void main(String[] args) {
		
		// Buat instance dari Pages API.
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.docx");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Ekstraktor Dokumen Word Online Gratis

Bagaimana cara mengekstrak halaman dokumen Word secara gratis? Silakan coba ekstraktor halaman Word online untuk mengekstrak halaman tertentu dari dokumen Word secara gratis. Alat ekstraktor halaman Word online ini dikembangkan menggunakan API Cloud Groupdocs.Merger yang disebutkan di atas.

Kesimpulan

Kesimpulannya, GroupDocs.Merger Cloud SDK untuk Java adalah pilihan tepat yang dapat membantu pengembang mengekstrak halaman dari dokumen Word secara online. Berikut ini adalah apa yang telah Anda pelajari dalam artikel ini:

  • cara mengekstrak halaman dari dokumen Word berdasarkan nomor halaman menggunakan Java;
  • unggah dan unduh dokumen Word secara terprogram di cloud;
  • ekstrak halaman Word DOCX di Java menggunakan rentang nomor halaman yang tepat;
  • dan ekstrak halaman dari Word secara gratis menggunakan alat ekstraktor halaman Word online.

Selain itu, kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berkomunikasi dengan API kami secara langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github. Silakan periksa GroupDocs.Merger Cloud SDK untuk Java Contoh di sini.

Selain itu, kami menyarankan Anda untuk mengikuti [Panduan Memulai] kami25 untuk langkah-langkah mendetail dan penggunaan API.

Terakhir, kami terus menulis postingan blog baru di berbagai operasi dokumen menggunakan REST API. Jadi, silakan hubungi untuk pembaruan rutin.

Berikan pertanyaan

Jika Anda memiliki pertanyaan tentang cara mengekstrak halaman dokumen, jangan ragu untuk bertanya kepada kami di Forum Dukungan Gratis.

FAQ

Bagaimana cara mengekstrak halaman dari dokumen Word online di Java?

Anda dapat mengekstrak halaman dari file Word menggunakan GroupDocs.Merger Cloud SDK for Java dan merampingkan alur kerja Anda.

Bisakah saya mengekstrak halaman tertentu menggunakan REST API?

Ya, Anda dapat menentukan nomor halaman dalam format array untuk mengekstrak halaman tertentu menggunakan GroupDocs.Merger Cloud SDK for Java.

Format file apa yang didukung oleh GroupDocs.Merger Cloud SDK untuk Java?

GroupDocs.Merger Cloud SDK untuk Java mendukung berbagai format file, termasuk Word, Excel, JPG, PowerPoint, PDF, HTML, dan banyak lagi.

Bisakah saya mengekstrak banyak halaman dari file Word menggunakan GroupDocs.Merger Cloud SDK untuk Java?

Ya, Anda dapat mengekstrak banyak halaman dari dokumen Word menggunakan GroupDocs.Merger Cloud SDK for Java dengan menentukan rentang halaman yang ingin Anda ekstrak.

Lihat juga

Berikut adalah beberapa artikel terkait yang mungkin bermanfaat bagi Anda: