Word Document Parser – Ekstrak Gambar dari File Word Online di Java

Penguraian dokumen adalah tugas penting di banyak industri yang memerlukan ekstraksi data dari berbagai format dokumen. Saat bekerja dengan dokumen Word, mengekstrak gambar bisa sangat berguna dalam kasus seperti analisis konten, pengenalan gambar, atau visualisasi data. Mengekstrak gambar secara manual dari dokumen Word berukuran besar dapat menghabiskan waktu. Oleh karena itu, mengotomatiskan proses ekstraksi gambar dapat menghemat waktu dan tenaga Anda. Pada artikel ini, kami akan mendemonstrasikan cara mengekstrak gambar dari dokumen Word secara terprogram di Java.

Topik-topik berikut akan dibahas dalam artikel ini:

Java REST API untuk Mengekstrak Gambar dari Dokumen Word dan Instalasi SDK

GroupDocs.Parser Cloud SDK for Java adalah library Java andal yang menyediakan cara sederhana dan efisien untuk mengurai dan mengekstrak data dari berbagai format dokumen, termasuk dokumen Word. Ini menawarkan berbagai fitur untuk penguraian dokumen, memungkinkan pengembang untuk mengekstrak gambar, teks, metadata, dan banyak lagi. GroupDocs.Parser juga menyediakan C#.NET, Java, PHP, Ruby, dan Python SDK sebagai anggota keluarga parser dokumen untuk API Cloud.

Untuk memulai, Anda perlu menyertakan SDK Cloud GroupDocs.Parser dalam proyek Java Anda. Anda dapat mengunduh file JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan dependensi berikut ke dalam file pom.xml proyek Anda:

Repositori Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Ketergantungan Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Selanjutnya, Anda perlu mendaftar untuk mendapatkan akun uji coba gratis atau membeli paket langganan di situs web GroupDocs dan dapatkan kunci API Anda. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:

# Dapatkan client_id dan client_secret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Cara Mengekstrak Semua Gambar dari Dokumen Word di Java menggunakan REST API

Untuk mengekstrak gambar dari dokumen Word di Java menggunakan GroupDocs.Parser Cloud SDK, ikuti langkah-langkah berikut dan contoh cuplikan kode:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas ParseApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Selanjutnya, atur path ke dokumen Word input.
  • Kemudian, buat instance dari kelas ImagesOptions() .
  • Selanjutnya, tetapkan fileInfo ke opsi gambar setFileInfo.
  • Sekarang, buat instance dari kelas ImagesRequest() dan berikan parameter ImagesOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan meneruskan parameter ImagesRequest.

Contoh kode berikut menunjukkan cara mengekstrak semua gambar dari dokumen Word online di Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Cara mengekstrak gambar dari dokumen Word di Java.
public class App {

	public static void main(String[] args) {
		
		// Buat instance Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Ekstrak Gambar Tertentu dari File Word di Java menggunakan Nomor Halaman

Di bagian ini, kami akan menulis langkah-langkah dan cuplikan kode contoh untuk mengekstrak gambar tertentu dari dokumen Word secara terprogram di Java:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas ParseApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Selanjutnya, atur path ke file Word sebagai input.
  • Kemudian, buat instance dari kelas ImagesOptions() .
  • Selanjutnya, tetapkan fileInfo ke opsi gambar setFileInfo.
  • Kemudian, berikan nilai setStartPageNumber dan setCountPagesToExtract.
  • Sekarang, buat instance dari kelas ImagesRequest() dan berikan parameter ImagesOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan meneruskan parameter ImagesRequest.

Contoh kode berikut menunjukkan cara mengekstrak gambar tertentu dari file Word berdasarkan rentang halaman di Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Ekstrak gambar dari file Word online berdasarkan rentang halaman di Java.
public class App {

	public static void main(String[] args) {
		
		// Buat instance Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Ekstraktor Gambar Online Gratis

Apa cara terbaik untuk mengekstrak gambar dari Word online secara gratis? Silakan coba parser dokumen Word online untuk mengekstrak gambar dari Word. Alat Word Parser ini dikembangkan menggunakan perpustakaan parser Java yang disebutkan di atas.

Kesimpulan

Kesimpulannya, GroupDocs.Parser Cloud SDK adalah solusi terbaik untuk mengekstraksi gambar dari dokumen Word, menghemat waktu dan tenaga sambil memastikan hasil yang akurat. Berikut ini adalah apa yang telah Anda pelajari dari artikel ini:

  • cara mengekstrak semua gambar dari Word DOCX secara terprogram di Java menggunakan REST API;
  • cara mengekstrak gambar tertentu dari dokumen Word di Java menggunakan REST API;
  • dan alat ekstraksi gambar online untuk mengekstrak gambar dari dokumen Word.

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github.

Terakhir, kami terus menulis artikel blog baru dalam berbagai format file dan mem-parsingnya menggunakan REST API. Jadi, silakan hubungi untuk pembaruan terbaru.

Berikan pertanyaan

Jika Anda memiliki pertanyaan tentang cara mengekstrak gambar dari dokumen, jangan ragu untuk menghubungi kami melalui forum.

FAQ

Bagaimana cara mengurai dokumen Word di Java?

Untuk mengekstrak gambar atau teks, pertama-tama Anda harus memuat dan mengurai dokumen Word menggunakan GroupDocs.Parser Cloud SDK. Proses ini melibatkan penentuan jalur file dan memanggil metode Parse untuk mengurai dokumen.

Bisakah GroupDocs.Parser Cloud SDK mengekstrak gambar dari format dokumen lain?

Ya, GroupDocs.Parser Cloud SDK for Java mendukung ekstraksi gambar dari berbagai format dokumen, termasuk Word, PDF, Excel, PowerPoint, dan banyak lagi.

Bisakah GroupDocs.Parser Cloud SDK mengekstrak banyak gambar dari satu dokumen Word?

Ya, SDK dapat mengekstrak banyak gambar dari satu dokumen Word, memberi Anda semua gambar yang ada di dalam dokumen.

Apakah SDK Cloud GroupDocs.Parser mempertahankan kualitas gambar asli selama proses ekstraksi?

Ya, GroupDocs.Parser Cloud SDK for Java mempertahankan kualitas gambar asli saat mengekstraksi gambar dari dokumen Word.

Lihat juga

Berikut adalah beberapa artikel terkait yang mungkin bermanfaat bagi Anda: