Витягувати зображення з PDF-документів у Java

PDF Файл Парсер – Витягти Зображення з PDF Файлів Онлайн у Java

PDF(Portable Document Format) є широко використовуваним форматом файлів для обміну та збереження документів онлайн. Він часто містить різні типи вмісту, включаючи текст, зображення, таблиці та інше. Витягування конкретного вмісту з PDF-файлів, наприклад, зображень, може бути складним завданням без надійних інструментів або бібліотеки. Одним із таких інструментів є GroupDocs.Parser Cloud SDK для Java, який надає безперешкодний та ефективний спосіб витягувати зображення з PDF-файлів. У цій статті ми продемонструємо, як витягувати зображення з PDF-файлів у Java, використовуючи REST API.

У цій статті будуть розглянуті такі теми:

Java REST API для відокремлення зображень з PDF та встановлення SDK
Як витягнути всі зображення з файлів PDF в Java за допомогою REST API
Витяг специфічних зображень з PDF-файлів у Java, використовуючи номер сторінки

Java REST API to Separate Images from PDF and SDK Installation

GroupDocs.Parser Cloud SDK for Java є потужною та універсальною бібліотекою Java, яка забезпечує простий та ефективний спосіб аналізувати та витягувати дані з різних форматів документів, включаючи PDF-файли. Вона пропонує широкий спектр функцій для парсингу документів, що дозволяє розробникам витягувати зображення, текст, метадані та інші вмісти. GroupDocs.Parser також надає C#.NET, Java, PHP, Ruby та Python SDK як своїх членів сім’ї парсерів документів для Cloud APIs.

Щоб почати, вам потрібно включити GroupDocs.Parser Cloud SDK у ваш Java проект. Ви можете або download JAR файл API, або встановити його за допомогою Maven, додавши наступний репозиторій і залежність у файл pom.xml вашого проекту:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven залежність:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Далі вам потрібно sign up для безкоштовного пробного акаунту або purchase a subscription plan на веб-сайті GroupDocs і get your API key. Коли ви отримаєте Client Id і Client Secret, додайте наведену нижче частину коду до програми на базі Java:

# Отримайте ваш clientid та clientsecret з https://dashboard.groupdocs.cloud після реєстрації.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Як витягти всі зображення з PDF-файлів у Java за допомогою REST API

Тепер давайте напишемо кроки та приклад коду для видобутку зображень з PDF-файлів за допомогою GroupDocs.Parser Cloud SDK для Java:

По-перше, імпортуйте необхідні класи у ваш Java файл.
По-друге, створіть екземпляр класу ParseApi.
По-третє, створіть екземпляр класу FileInfo.
Далі задайте шлях до вхідного PDF-документа.
Тоді створіть екземпляр класу ImagesOptions().
Наступним кроком, призначте fileInfo параметру setFileInfo image.
Тепер створіть екземпляр класу ImagesRequest() та передайте параметр ImagesOptions.
Нарешті, отримайте результати, викликавши метод ParseApi.images() та передавши параметр ImagesRequest.

Наведений нижче приклад коду демонструє, як вилучити всі зображення з PDF-файлу в Інтернеті на Java, використовуючи REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// How to extract images from a PDF file in Java.
public class App {

	public static void main(String[] args) {
		
		// Створіть екземпляр Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Підготуйте налаштування
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Отримати шлях до вихідного файлу
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Витягти специфічні зображення з PDF файлів у Java за допомогою номеру сторінки

В цьому розділі ми надамо кроки та фрагмент коду для програмного вилучення конкретних зображень з PDF файлу на Java:

По-перше, імпортуйте необхідні класи у ваш Java файл.
По-друге, створіть екземпляр класу ParseApi.
По-третє, створіть екземпляр класу FileInfo.
Далі задайте шлях до вхідного PDF-документа.
Тоді створіть екземпляр класу ImagesOptions().
Наступним кроком, призначте fileInfo параметру setFileInfo image.
Тоді надайте значення setStartPageNumber та setCountPagesToExtract.
Тепер створіть екземпляр класу ImagesRequest() та передайте параметр ImagesOptions.
Нарешті, отримайте результати, викликавши метод ParseApi.images() і передавши параметр ImagesRequest.

Наступний зразок коду демонструє, як витягувати певні зображення з файлу PDF за діапазоном сторінок у Java, використовуючи REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Витягніть зображення з PDF-файлу онлайн за діапазоном сторінок на Java.
public class App {

	public static void main(String[] args) {
		
		// Створіть екземпляр Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Підготуйте налаштування
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Отримати шлях до вихідного файлу
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Безкоштовний онлайн витягач зображень

Який найкращий спосіб безкоштовно витягувати зображення з PDF онлайн? Будь ласка, спробуйте online PDF File parser для витягування зображень з PDF файлів. Це програмне забезпечення PDF Parser було розроблено з використанням Java, як зазначено вище в бібліотеці парсерів.

Висновок

На завершення, GroupDocs.Parser Cloud SDK для Java пропонує надійне та ефективне рішення для легкого витягування зображень з PDF-файлів. Нижче наведено те, що ви дізналися з цієї статті:

How to extract all images from PDF files programmatically in Java using REST API;
Як витягти конкретні зображення з PDF-документів в Java, використовуючи REST API;
Онлайн інструмент для вилучення зображень, щоб витягувати зображення з PDF документів.

Додатково, ви можете дізнатися більше про GroupDocs.Parser Cloud API, використовуючи документацію. Ми також надаємо розділ API Reference, який дозволяє вам візуалізувати та взаємодіяти з нашими API безпосередньо через браузер. Повний вихідний код Java SDK доступний безкоштовно на Github.

Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.

Ask a question

У разі, якщо у вас є будь-які запитання щодо того, як аналізувати документи, не соромтеся звертатися до нас через наш forum.

Часто задавані питання

How do I parse PDF files using Java?

Щоб витягти зображення, текст або метадані, спочатку потрібно завантажити та проаналізувати PDF-документ, використовуючи GroupDocs.Parser Cloud SDK. Цей процес передбачає вказівку шляху до файлу та виклик методу Parse для аналізу PDF-файлів.

Чи підтримує GroupDocs.Parser Cloud SDK для Java інші формати файлів, окрім PDF?

Так, крім файлів PDF, GroupDocs.Parser Cloud SDK для Java підтримує вилучення зображень з різних форматів документів, включаючи Word, Excel, PowerPoint, HTML та багато інших.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

Так, ви можете извлечи всі зображення з файлу PDF, використовуючи GroupDocs.Parser Cloud SDK для Java.

Дивіться також

Ось кілька пов’язаних статей, які можуть виявитися корисними:

Java REST API to Separate Images from PDF and SDK Installation#

Як витягти всі зображення з PDF-файлів у Java за допомогою REST API#

Витягти специфічні зображення з PDF файлів у Java за допомогою номеру сторінки#

Безкоштовний онлайн витягач зображень#

Висновок#

Ask a question#

Часто задавані питання#

Дивіться також#