Jika Anda bekerja dengan file PDF, Anda mungkin berada dalam situasi di mana Anda perlu mengekstrak halaman dari file PDF. Mengekstrak halaman dari file PDF bisa menjadi tugas yang memakan waktu, terutama jika Anda harus melakukannya secara manual atau berurusan dengan dokumen berukuran besar. Untungnya, dengan bantuan GroupDocs.Merger Cloud SDK untuk Java, Anda dapat dengan mudah mengekstrak halaman dari file PDF secara terprogram. Pada artikel ini, kita akan mengeksplorasi cara mengekstrak halaman dari PDF di Java.
Topik-topik berikut akan dibahas dalam artikel ini:
- Java PDF Pages Extractor REST API dan Pemasangan SDK
- Cara Mengekstrak Halaman PDF dengan Nomor Halaman Tepat di Java
- Cara Mengekstrak Halaman dari PDF dengan Rentang Halaman menggunakan Java
Java PDF Pages Extractor REST API dan Instalasi SDK
GroupDocs.Merger Cloud SDK for Java adalah API berbasis cloud yang memungkinkan pengembang menggabungkan, mengekstrak, membagi, menyusun ulang, dan menghapus halaman dari file dan jenis dokumen lain, termasuk Word, Excel , PowerPoint, HTML, PDF, dan banyak lagi. SDK yang kuat ini mudah digunakan dan dapat diintegrasikan ke dalam aplikasi berbasis Java untuk mengotomatiskan tugas manipulasi file.
Anda dapat mengunduh file JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan dependensi berikut ke dalam file pom.xml proyek Anda:
Repositori Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Ketergantungan Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger-cloud</artifactId>
<version>23.2</version>
<scope>compile</scope>
</dependency>
Sekarang, Anda perlu mendaftar untuk mendapatkan akun uji coba gratis atau membeli paket langganan di situs web GroupDocs untuk mendapatkan kunci API Anda. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:
# Dapatkan client_id dan client_secret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Cara Mengekstrak Halaman PDF dengan Nomor Halaman Tepat di Java
Untuk mengekstrak halaman dari file PDF menggunakan GroupDocs.Merger Cloud SDK untuk Java, Anda harus mengikuti langkah-langkah berikut:
Unggah Berkas
Pertama, unggah file PDF ke cloud menggunakan contoh kode yang diberikan di bawah ini:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Unggah file ke Cloud Storage menggunakan Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Hasilnya, file PDF yang diunggah akan tersedia di bagian file dasbor Anda di cloud.
Ekstrak Halaman dari File PDF di Java
Berikut panduan langkah demi langkah dan cuplikan kode contoh tentang cara mengekstrak halaman dari file PDF menggunakan GroupDocs.Merger Cloud SDK untuk Java:
- Pertama, impor kelas yang diperlukan ke file Java Anda.
- Kedua, buat instance dari kelas PagesApi.
- Ketiga, buat instance dari kelas FileInfo.
- Setelah itu, atur jalur file input sumber.
- Sekarang, buat instance dari kelas ExtractOptions().
- Kemudian, tentukan opsi ekstrak setFileInfo, setOutputPath, dan koleksi setPages dalam format array.
- Sekarang, buat instance dari kelas ExtractRequest() dan berikan parameter ExtractOptions.
- Terakhir, ekstrak halaman dengan memanggil metode extract() dari PagesApi dan meneruskan parameter ExtractRequest.
Cuplikan kode berikut menunjukkan cara memisahkan file PDF menjadi halaman individual di Java menggunakan REST API:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Cara mengekstrak halaman PDF dengan nomor halaman Exact di Java.
public class App {
public static void main(String[] args) {
// Buat instance API Halaman.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Siapkan pengaturan
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setPages(Arrays.asList(3, 5, 7));
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Dapatkan jalur file keluaran
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Unduh File
Contoh kode di atas akan menyimpan halaman PDF tertentu di cloud. Anda dapat mengunduhnya menggunakan contoh kode berikut:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Unduh File dari Cloud Storage menggunakan Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.out.println("Expected response type is downloadFile: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Cara Mengekstrak Halaman dari PDF berdasarkan Rentang Halaman menggunakan Java
Pada bagian ini kita akan membahas panduan langkah demi langkah dan cuplikan kode contoh untuk menyimpan halaman yang dipilih dari PDF menggunakan Java dengan menerapkan rentang halaman:
- Pertama, impor kelas yang diperlukan ke file Java Anda.
- Kedua, buat instance dari kelas PagesApi.
- Ketiga, buat instance dari kelas FileInfo.
- Setelah itu, atur jalur file input sumber.
- Sekarang, buat instance dari kelas ExtractOptions().
- Kemudian, tentukan opsi ekstrak setFileInfo, setOutputPath, setStartPageNumber, dan setEndPageNumber.
- Selanjutnya, setel opsi halaman setRangeMode ke EVENPAGES.
- Sekarang, buat instance dari kelas ExtractRequest() dan berikan parameter ExtractOptions.
- Terakhir, ekstrak halaman dengan memanggil metode extract() dari PagesApi dan meneruskan parameter ExtractRequest.
Cuplikan kode berikut menunjukkan cara mengekstrak halaman PDF dengan menerapkan rentang dan mode halaman di Java:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Cara mengekstrak halaman dari PDF berdasarkan rentang halaman menggunakan Java.
public class App {
public static void main(String[] args) {
// Buat instance API Halaman.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Siapkan pengaturan
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setStartPageNumber(1);
options.setEndPageNumber(10);
options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Dapatkan jalur file keluaran
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Ekstraktor Halaman PDF Online Gratis
Bagaimana cara mengekstrak halaman PDF secara gratis? Silakan coba ekstraktor halaman PDF gratis untuk mengekstrak halaman tertentu dari PDF secara gratis. Ekstraktor halaman PDF online ini dikembangkan menggunakan API Cloud Groupdocs.Merger yang disebutkan di atas.
Kesimpulan
GroupDocs.Merger Cloud SDK untuk Java menyediakan cara mudah untuk mengekstrak halaman PDF ke PDF baru di Java. Berikut ini adalah apa yang telah Anda pelajari dalam artikel ini:
- cara memisahkan file PDF menjadi beberapa halaman dengan nomor menggunakan Java;
- unggah dan unduh file PDF secara terprogram menggunakan Java di cloud;
- pisahkan PDF menjadi halaman individual di Java menggunakan rentang halaman;
- dan ekstrak halaman dari PDF online secara gratis menggunakan ekstraktor halaman PDF online gratis.
Selain itu, kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berkomunikasi dengan API kami secara langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github. Silakan periksa GroupDocs.Merger Cloud SDK untuk Java Contoh di sini.
Selain itu, kami menyarankan Anda untuk mengikuti [Panduan Memulai] kami26 untuk langkah-langkah mendetail dan penggunaan API.
Terakhir, kami terus menulis postingan blog baru di berbagai operasi dokumen menggunakan REST API. Jadi, silakan hubungi untuk pembaruan rutin.
Berikan pertanyaan
Jika Anda memiliki pertanyaan tentang API ekstraktor halaman PDF, jangan ragu untuk bertanya kepada kami di Forum Dukungan Gratis.
FAQ
Bagaimana cara mengekstrak halaman dari file PDF di Java?
Anda dapat mengekstrak halaman dari file PDF menggunakan GroupDocs.Merger Cloud SDK for Java.
Apakah mungkin untuk mengekspor satu halaman dari PDF di Java?
Ya, Anda dapat mengekstrak halaman PDF menjadi file tunggal secara terprogram di Java menggunakan GroupDocs.Merger Cloud SDK for Java.
Format file apa yang dapat saya ekstrak dari halaman menggunakan GroupDocs.Merger Cloud SDK untuk Java?
Selain file PDF, GroupDocs.Merger Cloud SDK untuk Java dapat mengekstrak halaman dari Microsoft Word, Excel, PowerPoint, HTML, dan format file lainnya.
Lihat juga
Berikut adalah beberapa artikel terkait yang mungkin bermanfaat bagi Anda:
- Pisahkan Dokumen Word menjadi File Terpisah di Java
- Cara Menggabungkan Dokumen Word (DOC, DOCX) di Java
- Cara Membagi Slide PowerPoint PPT atau PPTX dengan Python
- Ekstrak Halaman Tertentu dari PDF menggunakan Python
- Ekstrak Halaman Dari Dokumen Word menggunakan Rest API
- Menggabungkan File PowerPoint PPT/PPTX Online menggunakan REST API
- Cara Mengubah Orientasi Halaman di Dokumen Word menggunakan Ruby
- Cara Membagi Dokumen Word menjadi File Terpisah menggunakan Node.js