Парсер PDF-файлів – витягуйте зображення з PDF-файлів онлайн на Java

PDF(Portable Document Format) – широко використовуваний формат файлів для спільного використання та збереження документів в Інтернеті. Він часто містить різні типи вмісту, включаючи текст, зображення, таблиці тощо. Витяг певного вмісту з файлів PDF, наприклад зображень, може бути складним завданням без надійних інструментів чи бібліотеки. Одним із таких інструментів є GroupDocs.Parser Cloud SDK для Java, який забезпечує безпроблемний та ефективний спосіб видобування зображень із файлів PDF. У цій статті ми продемонструємо, як видобувати зображення з PDF-файлів у Java за допомогою REST API.

У цій статті будуть розглянуті такі теми:

Java REST API для відокремлення зображень від PDF та встановлення SDK

GroupDocs.Parser Cloud SDK for Java — це потужна й універсальна бібліотека Java, яка забезпечує простий і ефективний спосіб аналізу та витягування даних із різних форматів документів, включаючи файли PDF. Він пропонує широкий спектр функцій для аналізу документів, дозволяючи розробникам видобувати зображення, текст, метадані та інший вміст. GroupDocs.Parser також надає C#.NET, Java, PHP, Ruby та Python SDK як члени сімейства парсерів документів для Cloud API.

Щоб почати, вам потрібно включити GroupDocs.Parser Cloud SDK у свій проект Java. Ви можете завантажити JAR-файл API або встановити його за допомогою Maven, додавши таке сховище та залежність у файл pom.xml вашого проекту:

Репозиторій Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Залежність Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Далі вам потрібно зареєструватися для безкоштовного пробного облікового запису або придбати план підписки на веб-сайті GroupDocs і отримати ключ API. Отримавши ідентифікатор клієнта та секрет клієнта, додайте наведений нижче фрагмент коду до програми на основі Java:

# Отримайте свій client_id і client_secret на https://dashboard.groupdocs.cloud після реєстрації.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Як витягти всі зображення з PDF-файлів у Java за допомогою REST API

Тепер давайте напишемо кроки та приклад фрагмента коду для вилучення зображень із PDF-файлів за допомогою GroupDocs.Parser Cloud SDK для Java:

  • По-перше, імпортуйте необхідні класи у свій файл Java.
  • По-друге, створіть екземпляр класу ParseApi.
  • По-третє, створіть екземпляр класу FileInfo.
  • Далі встановіть шлях до вхідного документа PDF.
  • Потім створіть екземпляр класу ImagesOptions().
  • Далі призначте fileInfo параметру зображення setFileInfo.
  • Тепер створіть екземпляр класу ImagesRequest() і передайте параметр ImagesOptions.
  • Нарешті, отримуйте результати, викликавши метод ParseApi.images() і передавши параметр ImagesRequest.

У наведеному нижче прикладі коду показано, як витягнути всі зображення з PDF-файлу онлайн на Java за допомогою REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Як витягти зображення з PDF-файлу в Java.
public class App {

	public static void main(String[] args) {
		
		// Створіть примірник API аналізу
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Підготуйте налаштування
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Отримати вихідний шлях до файлу
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Витягніть певні зображення з PDF-файлів у Java за допомогою номера сторінки

У цьому розділі ми надамо кроки та фрагмент коду для програмного видобування певних зображень із PDF-файлу в Java:

  • По-перше, імпортуйте необхідні класи у свій файл Java.
  • По-друге, створіть екземпляр класу ParseApi.
  • По-третє, створіть екземпляр класу FileInfo.
  • Далі встановіть шлях до вхідного документа PDF.
  • Потім створіть екземпляр класу ImagesOptions().
  • Далі призначте fileInfo параметру зображення setFileInfo.
  • Потім укажіть значення setStartPageNumber і setCountPagesToExtract.
  • Тепер створіть екземпляр класу ImagesRequest() і передайте параметр ImagesOptions.
  • Нарешті, отримуйте результати, викликавши метод ParseApi.images() і передавши параметр ImagesRequest.

У наведеному нижче прикладі коду показано, як видобувати певні зображення з PDF-файлу за діапазоном сторінок у Java за допомогою REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Видобувайте зображення з PDF-файлу онлайн за діапазоном сторінок у Java.
public class App {

	public static void main(String[] args) {
		
		// Створіть примірник API аналізу
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Підготуйте налаштування
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Отримати вихідний шлях до файлу
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Безкоштовний онлайн-екстрактор зображень

Який найкращий спосіб безкоштовно видобувати зображення з PDF онлайн? Спробуйте онлайн-аналізатор PDF-файлів, щоб отримати зображення з PDF-файлів. Це програмне забезпечення PDF Parser розроблено з використанням згаданої вище бібліотеки аналізатора Java.

Висновок

Підсумовуючи, GroupDocs.Parser Cloud SDK для Java забезпечує надійне та ефективне рішення для легкого вилучення зображень із файлів PDF. Ось що ви дізналися з цієї статті:

  • як витягти всі зображення з PDF-файлів програмним шляхом у Java за допомогою REST API;
  • як витягувати певні зображення з PDF-документів у Java за допомогою REST API;
  • і онлайн-інструмент для вилучення зображень із PDF-документів.

Крім того, ви можете дізнатися більше про GroupDocs.Parser Cloud API за допомогою документації. Ми також надаємо розділ API Reference, який дозволяє візуалізувати наші API та взаємодіяти з ними безпосередньо через браузер. Повний вихідний код Java SDK є у вільному доступі на Github.

Нарешті, ми продовжуємо писати нові статті в блозі про різні формати файлів і аналізувати їх за допомогою REST API. Тому, будь ласка, зв’яжіться з нами, щоб отримати останні оновлення.

Задайте питання

Якщо у вас виникнуть запитання щодо аналізу документів, будь ласка, зв’яжіться з нами через наш форум.

поширені запитання

Як розібрати PDF-файли за допомогою Java?

Щоб отримати зображення, текст або метадані, спочатку потрібно завантажити та проаналізувати PDF-документ за допомогою GroupDocs.Parser Cloud SDK. Цей процес передбачає вказівку шляху до файлу та виклик методу Parse для аналізу PDF-файлів.

Чи підтримує GroupDocs.Parser Cloud SDK для Java інші формати файлів, крім PDF?

Так, окрім PDF-файлів, GroupDocs.Parser Cloud SDK for Java підтримує видобування зображень із різних форматів документів, зокрема Word, Excel, PowerPoint, HTML тощо.

Чи можна отримати всі зображення з PDF-файлу за допомогою GroupDocs.Parser Cloud SDK для Java?

Так, ви можете витягнути всі зображення з файлу PDF за допомогою GroupDocs.Parser Cloud SDK для Java.

Дивись також

Ось деякі пов’язані статті, які можуть бути вам корисними: