
Pemrosesan dokumen adalah tugas penting di banyak industri di mana ekstraksi data dari berbagai format dokumen diperlukan. Saat bekerja dengan Word dokumen, mengekstrak gambar bisa sangat berguna dalam kasus seperti analisis konten, pengenalan gambar, atau visualisasi data. Mengekstrak gambar secara manual dari dokumen Word yang besar bisa memakan waktu. Oleh karena itu, mengotomatiskan proses ekstraksi gambar dapat menghemat waktu dan tenaga Anda. Dalam artikel ini, kami akan menunjukkan cara mengekstrak gambar dari dokumen Word secara programatis dalam Java.
Topik-topik berikut akan dibahas dalam artikel ini:
- Java REST API to Extract Images from Word Documents and SDK Installation
- How to Extract All Images from Word Documents in Java using REST API
- Extract Specific Images from Word File in Java using Page Number
Java REST API untuk Mengekstrak Gambar dari Dokumen Word dan Instalasi SDK
GroupDocs.Parser Cloud SDK for Java adalah pustaka Java yang kuat yang menyediakan cara sederhana dan efisien untuk mem-parse dan mengekstrak data dari berbagai format dokumen, termasuk dokumen Word. Ini menawarkan berbagai fitur untuk pemrosesan dokumen, memungkinkan pengembang untuk mengekstrak gambar, teks, metadata, dan lainnya. GroupDocs.Parser juga menyediakan C#.NET, Java, PHP, Ruby, dan Python SDK sebagai anggota keluarga pemroses dokumen untuk Cloud API.
Untuk memulai, Anda perlu menyertakan GroupDocs.Parser Cloud SDK dalam proyek Java Anda. Anda dapat download file JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan ketergantungan berikut ke dalam file pom.xml proyek Anda:
Maven Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven Dependency:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Selanjutnya, Anda perlu sign up untuk akun percobaan gratis atau purchase a subscription plan di situs web GroupDocs dan get your API key. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:
# Dapatkan clientid dan clientsecret Anda dari https://dashboard.groupdocs.cloud setelah registrasi.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Bagaimana Cara Mengekstrak Semua Gambar dari Dokumen Word di Java menggunakan REST API
Untuk mengekstrak gambar dari dokumen Word di Java menggunakan GroupDocs.Parser Cloud SDK, ikuti langkah-langkah berikut dan cuplikan kode contoh:
- Pertama, impor kelas yang diperlukan ke dalam file Java Anda.
- Kedua, buatlah sebuah instance dari kelas ParseApi.
- Ketiga, buatlah sebuah instance dari kelas FileInfo.
- Selanjutnya, atur jalur ke dokumen Word input.
- Kemudian, buatlah sebuah instance dari kelas ImagesOptions().
- Selanjutnya, tetapkan fileInfo ke opsi gambar setFileInfo.
- Sekarang, buat sebuah instance dari kelas ImagesRequest() dan berikan parameter ImagesOptions.
- Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan melewatkan parameter ImagesRequest.
Kode sampel berikut menunjukkan cara mengekstrak semua gambar dari dokumen Word secara online di Java menggunakan REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Cara mengekstrak gambar dari dokumen Word di Java.
public class App {
public static void main(String[] args) {
// Buat instance dari Parse API
ParseApi apiInstance = new ParseApi(configuration);
try {
// Siapkan pengaturan
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Dapatkan jalur file keluaran
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Ekstrak Gambar Spesifik dari File Word di Java Menggunakan Nomor Halaman
Pada bagian ini, kami akan menulis langkah-langkah dan cuplikan kode contoh untuk mengekstrak gambar tertentu dari dokumen Word secara programatis dalam Java:
- Pertama, impor kelas yang diperlukan ke dalam file Java Anda.
- Kedua, buatlah sebuah instance dari kelas ParseApi.
- Thirdly, create an instance of the FileInfo class.
- Selanjutnya, atur jalur ke file Word sebagai input.
- Kemudian, buatlah sebuah instance dari kelas ImagesOptions().
- Selanjutnya, tetapkan fileInfo ke opsi gambar setFileInfo.
- Kemudian, berikan nilai setStartPageNumber dan setCountPagesToExtract.
- Sekarang, buat sebuah instance dari kelas ImagesRequest() dan berikan parameter ImagesOptions.
- Akhirnya, dapatkan hasil dengan memanggil metode ParseApi.images() dan meneruskan parameter ImagesRequest.
Kode sampel berikut menunjukkan cara mengekstrak gambar tertentu dari file Word berdasarkan rentang halaman dalam Java menggunakan REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Extract gambar dari file Word secara online berdasarkan rentang halaman di Java.
public class App {
public static void main(String[] args) {
// Buat sebuah instance dari Parse API
ParseApi apiInstance = new ParseApi(configuration);
try {
// Siapkan pengaturan
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Dapatkan path file output
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extractor Gambar Online Gratis
Apa cara terbaik untuk mengekstrak gambar dari Word online secara gratis? Silakan coba online Word document parser untuk mengekstrak gambar dari Word. Alat Word Parser ini dikembangkan menggunakan pustaka parser Java yang disebutkan di atas.
Kesimpulan
Sebagai kesimpulan, GroupDocs.Parser Cloud SDK adalah solusi yang luar biasa untuk mengekstrak gambar dari dokumen Word, menghemat waktu dan usaha sambil memastikan hasil yang akurat. Berikut adalah apa yang telah Anda pelajari dari artikel ini:
- how to extract all images from Word DOCX programmatically in Java using REST API;
- how to extract specific images from Word documents in Java using REST API;
- dan alat ekstraksi gambar online untuk mengekstrak gambar dari dokumen Word.
Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan documentation. Kami juga menyediakan bagian API Reference yang memungkinkan Anda untuk memvisualisasikan dan berinteraksi dengan API kami langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github.
Akhirnya, kami terus menulis artikel blog baru tentang berbagai format file dan memparsingnya menggunakan REST API. Jadi, silakan menghubungi kami untuk pembaruan terbaru.
Ask a question
Jika Anda memiliki pertanyaan tentang cara mengekstrak gambar dari dokumen, jangan ragu untuk menghubungi kami melalui forum.
FAQs
Bagaimana cara saya mem-parsing dokumen Word di Java?
Untuk mengekstrak gambar atau teks, Anda terlebih dahulu perlu memuat dan mem-parsing dokumen Word menggunakan GroupDocs.Parser Cloud SDK. Proses ini melibatkan penentuan jalur file dan memanggil metode Parse untuk mem-parsing dokumen.
Bisakah GroupDocs.Parser Cloud SDK mengekstrak gambar dari format dokumen lainnya?
Ya, GroupDocs.Parser Cloud SDK untuk Java mendukung ekstraksi gambar dari berbagai format dokumen, termasuk Word, PDF, Excel, PowerPoint, dan banyak lagi.
Can the GroupDocs.Parser Cloud SDK extract multiple images from a single Word document?
Ya, SDK dapat mengekstrak beberapa gambar dari satu dokumen Word, memberikan Anda semua gambar yang terdapat dalam dokumen tersebut.
Apakah GroupDocs.Parser Cloud SDK mempertahankan kualitas gambar asli selama proses ekstraksi?
Ya, GroupDocs.Parser Cloud SDK untuk Java mempertahankan kualitas gambar asli saat mengekstrak gambar dari dokumen Word.
Lihat Juga
Berikut adalah beberapa artikel terkait yang mungkin Anda anggap berguna: