Parser File PDF – Ekstrak Gambar dari File PDF Online di Java

PDF(Portable Document Format) adalah format file yang banyak digunakan untuk berbagi dan menyimpan dokumen secara online. Ini sering berisi berbagai jenis konten, termasuk teks, gambar, tabel, dan lainnya. Mengekstrak konten tertentu dari file PDF, seperti gambar, bisa menjadi tugas yang menantang tanpa alat atau pustaka yang andal. Salah satu alat tersebut adalah GroupDocs.Parser Cloud SDK for Java, yang menyediakan cara yang mulus dan efisien untuk mengekstrak gambar dari file PDF. Pada artikel ini, kami akan mendemonstrasikan cara mengekstrak gambar dari file PDF di Java menggunakan REST API.

Topik-topik berikut akan dibahas dalam artikel ini:

Java REST API untuk Memisahkan Gambar dari Instalasi PDF dan SDK

GroupDocs.Parser Cloud SDK for Java adalah library Java yang andal dan serbaguna yang menyediakan cara sederhana dan efisien untuk mengurai dan mengekstrak data dari berbagai format dokumen, termasuk file PDF. Ini menawarkan berbagai fitur untuk penguraian dokumen, memungkinkan pengembang untuk mengekstrak gambar, teks, metadata, dan konten lainnya. GroupDocs.Parser juga menyediakan C#.NET, Java, PHP, Ruby, dan Python SDK sebagai anggota keluarga parser dokumen untuk API Cloud.

Untuk memulai, Anda perlu menyertakan SDK Cloud GroupDocs.Parser dalam proyek Java Anda. Anda dapat mengunduh file JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan ketergantungan berikut ke dalam file pom.xml proyek Anda:

Repositori Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Ketergantungan Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Selanjutnya, Anda perlu mendaftar untuk mendapatkan akun uji coba gratis atau membeli paket langganan di situs web GroupDocs dan dapatkan kunci API Anda. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:

# Dapatkan client_id dan client_secret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Cara Mengekstrak Semua Gambar dari File PDF di Java menggunakan REST API

Sekarang, mari tulis langkah-langkah dan contoh cuplikan kode untuk mengekstrak gambar dari file PDF menggunakan GroupDocs.Parser Cloud SDK for Java:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas ParseApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Selanjutnya, atur path ke dokumen PDF input.
  • Kemudian, buat instance dari kelas ImagesOptions() .
  • Selanjutnya, tetapkan fileInfo ke opsi gambar setFileInfo.
  • Sekarang, buat instance dari kelas ImagesRequest() dan berikan parameter ImagesOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan meneruskan parameter ImagesRequest.

Contoh kode berikut menunjukkan cara mengekstrak semua gambar dari file PDF online di Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Cara mengekstrak gambar dari file PDF di Java.
public class App {

	public static void main(String[] args) {
		
		// Buat instance Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Ekstrak Gambar Tertentu dari File PDF di Java menggunakan Nomor Halaman

Di bagian ini, kami akan memberikan langkah-langkah dan cuplikan kode untuk mengekstrak gambar tertentu dari file PDF secara terprogram di Java:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas ParseApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Selanjutnya, atur path ke dokumen PDF input.
  • Kemudian, buat instance dari kelas ImagesOptions() .
  • Selanjutnya, tetapkan fileInfo ke opsi gambar setFileInfo.
  • Kemudian, berikan nilai setStartPageNumber dan setCountPagesToExtract.
  • Sekarang, buat instance dari kelas ImagesRequest() dan berikan parameter ImagesOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan meneruskan parameter ImagesRequest.

Contoh kode berikut menunjukkan cara mengekstrak gambar tertentu dari file PDF berdasarkan rentang halaman di Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Ekstrak gambar dari file PDF secara online berdasarkan rentang halaman di Java.
public class App {

	public static void main(String[] args) {
		
		// Buat instance Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Ekstraktor Gambar Online Gratis

Apa cara terbaik untuk mengekstrak gambar dari PDF online secara gratis? Silakan coba parser File PDF online untuk mengekstrak gambar dari file PDF. Perangkat lunak Parser PDF ini dikembangkan menggunakan Java seperti yang disebutkan di atas perpustakaan parser.

Kesimpulan

Kesimpulannya, GroupDocs.Parser Cloud SDK untuk Java memberikan solusi yang andal dan efisien untuk mengekstraksi gambar dari file PDF dengan mudah. Berikut ini adalah apa yang telah Anda pelajari dari artikel ini:

  • cara mengekstrak semua gambar dari file PDF secara terprogram di Java menggunakan REST API;
  • cara mengekstrak gambar tertentu dari dokumen PDF di Java menggunakan REST API;
  • dan alat ekstraksi gambar online untuk mengekstrak gambar dari dokumen PDF.

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github.

Terakhir, kami terus menulis artikel blog baru dalam berbagai format file dan mem-parsingnya menggunakan REST API. Jadi, silakan hubungi untuk pembaruan terbaru.

Berikan pertanyaan

Jika Anda memiliki pertanyaan tentang cara mengurai dokumen, jangan ragu untuk menghubungi kami melalui forum kami.

FAQ

Bagaimana cara mengurai file PDF menggunakan Java?

Untuk mengekstrak gambar, teks, atau metadata, pertama-tama Anda harus memuat dan mengurai dokumen PDF menggunakan GroupDocs.Parser Cloud SDK. Proses ini melibatkan penentuan jalur file dan memanggil metode Parse untuk mengurai file PDF.

Apakah GroupDocs.Parser Cloud SDK untuk Java mendukung format file lain selain PDF?

Ya, selain file PDF, GroupDocs.Parser Cloud SDK for Java mendukung ekstraksi gambar dari berbagai format dokumen, termasuk Word, Excel, PowerPoint, HTML, dan banyak lagi.

Bisakah saya mengekstrak semua gambar dari file PDF menggunakan GroupDocs.Parser Cloud SDK untuk Java?

Ya, Anda dapat mengekstrak semua gambar dari file PDF menggunakan GroupDocs.Parser Cloud SDK for Java.

Lihat juga

Berikut adalah beberapa artikel terkait yang mungkin bermanfaat bagi Anda: