PDF File Parser – Ekstrak Gambar dari File PDF Secara Online di Java

PDF(Portable Document Format) adalah format file yang banyak digunakan untuk berbagi dan melestarikan dokumen secara online. Ini sering kali berisi berbagai jenis konten, termasuk teks, gambar, tabel, dan lainnya. Mengekstrak konten tertentu dari file PDF, seperti gambar, bisa menjadi tugas yang menantang tanpa alat atau pustaka yang andal. Salah satu alat tersebut adalah GroupDocs.Parser Cloud SDK untuk Java, yang menyediakan cara yang mulus dan efisien untuk mengekstrak gambar dari file PDF. Dalam artikel ini, kami akan menunjukkan cara mengekstrak gambar dari file PDF di Java menggunakan REST API.

Topik-topik berikut akan dibahas dalam artikel ini:

Java REST API untuk Memisahkan Gambar dari PDF dan Instalasi SDK

GroupDocs.Parser Cloud SDK untuk Java adalah perpustakaan Java yang kuat dan serbaguna yang menyediakan cara yang sederhana dan efisien untuk mem-parsing dan mengekstrak data dari berbagai format dokumen, termasuk file PDF. Ini menawarkan berbagai fitur untuk pemrosesan dokumen, memungkinkan pengembang untuk mengekstrak gambar, teks, metadata, dan konten lainnya. GroupDocs.Parser juga menyediakan SDK C#.NET, Java, PHP, Ruby, dan Python sebagai anggota keluarga pemroses dokumen untuk Cloud API.

Untuk memulai, Anda perlu menyertakan GroupDocs.Parser Cloud SDK dalam proyek Java Anda. Anda dapat download berkas JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan ketergantungan berikut ke dalam berkas pom.xml proyek Anda:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Selanjutnya, Anda perlu sign up untuk akun percobaan gratis atau purchase a subscription plan di situs web GroupDocs dan get your API key. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:

# Dapatkan clientid dan clientsecret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Bagaimana Cara Mengekstrak Semua Gambar dari File PDF di Java Menggunakan REST API

Sekarang, mari kita tulis langkah-langkah dan contoh potongan kode untuk mengekstrak gambar dari file PDF menggunakan GroupDocs.Parser Cloud SDK untuk Java:

  • Pertama, impor kelas-kelas yang diperlukan ke dalam file Java Anda.
  • Kedua, buat sebuah instance dari kelas ParseApi.
  • Ketiga, buatlah sebuah instance dari kelas FileInfo.
  • Selanjutnya, atur jalur ke dokumen PDF input.
  • Kemudian, buatlah sebuah instance dari kelas ImagesOptions().
  • Selanjutnya, tetapkan fileInfo ke opsi setFileInfo gambar.
  • Sekarang, buat sebuah instance dari kelas ImagesRequest() dan lewati parameter ImagesOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan melewatkan parameter ImagesRequest.

Kode contoh berikut menunjukkan cara mengekstrak semua gambar dari file PDF secara online dalam Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// How to extract images from a PDF file in Java.
public class App {

	public static void main(String[] args) {
		
		// Buat sebuah instance dari Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Dapatkan jalur file output
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Ekstrak Gambar Tertentu dari File PDF di Java menggunakan Nomor Halaman

Dalam bagian ini, kami akan memberikan langkah-langkah dan cuplikan kode untuk mengekstrak gambar tertentu dari file PDF secara programatis di Java:

  • Pertama, impor kelas-kelas yang diperlukan ke dalam file Java Anda.
  • Kedua, buatlah sebuah instance dari kelas ParseApi.
  • Ketiga, buatlah sebuah instance dari kelas FileInfo.
  • Selanjutnya, atur jalur ke dokumen PDF input.
  • Kemudian, buatlah sebuah instance dari kelas ImagesOptions().
  • Selanjutnya, tetapkan fileInfo ke opsi setFileInfo gambar.
  • Kemudian, berikan nilai setStartPageNumber dan setCountPagesToExtract.
  • Sekarang, buat sebuah instance dari kelas ImagesRequest() dan lewati parameter ImagesOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.images() dan meneruskan parameter ImagesRequest.

Kode contoh berikut menunjukkan cara mengekstrak gambar tertentu dari file PDF berdasarkan rentang halaman dalam Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Ekstrak gambar dari file PDF secara online berdasarkan rentang halaman dalam Java.
public class App {

	public static void main(String[] args) {
		
		// Buat sebuah instance dari Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturannya
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Free Online Images Extractor

What is the best way to extract images from PDF online for free? Please try an online PDF File parser to extract images from PDF files. This PDF Parser software is developed using the Java as mentioned above parser library.

Kesimpulan

Sebagai kesimpulan, GroupDocs.Parser Cloud SDK untuk Java menyediakan solusi yang handal dan efisien untuk mengekstrak gambar dari file PDF dengan mudah. Berikut adalah apa yang telah Anda pelajari dari artikel ini:

  • How to extract all images from PDF files programmatically in Java using REST API;
  • Bagaimana cara mengekstrak gambar tertentu dari dokumen PDF di Java menggunakan REST API;
  • Alat ekstraksi gambar online untuk mengekstrak gambar dari dokumen PDF.

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan documentation. Kami juga menyediakan bagian API Reference yang memungkinkan Anda untuk memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Kode sumber lengkap SDK Java tersedia secara gratis di Github.

Akhirnya, kami terus menulis artikel blog baru tentang berbagai format file dan memparsingnya menggunakan REST API. Jadi, silakan hubungi kami untuk pembaruan terbaru.

Ask a question

Jika Anda memiliki pertanyaan tentang cara menganalisis dokumen, silakan hubungi kami melalui forum.

FAQs

How do I parse PDF files using Java?

Untuk mengekstrak gambar, teks, atau metadata, Anda terlebih dahulu perlu memuat dan menganalisis dokumen PDF menggunakan GroupDocs.Parser Cloud SDK. Proses ini melibatkan penentuan jalur file dan memanggil metode Parse untuk menganalisis file PDF.

Apakah GroupDocs.Parser Cloud SDK untuk Java mendukung format file lain selain PDF?

Ya, selain file PDF, GroupDocs.Parser Cloud SDK for Java mendukung ekstraksi gambar dari berbagai format dokumen, termasuk Word, Excel, PowerPoint, HTML, dan banyak lagi.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

Ya, Anda dapat mengekstrak semua gambar dari file PDF menggunakan GroupDocs.Parser Cloud SDK for Java.

Lihat Juga

Berikut adalah beberapa artikel terkait yang mungkin Anda anggap berguna: