Как извлечь страницы PDF в Java

Извлечение страниц из PDF в Java - отдельные страницы PDF онлайн.

Если вы работаете с файлами PDF, вы можете столкнуться с ситуацией, когда вам нужно извлечь страницы из файла PDF. Извлечение страниц из PDF-файла может занять много времени, особенно если вам приходится делать это вручную или работать с большими документами. К счастью, с помощью GroupDocs.Merger Cloud SDK для Java вы можете легко программно извлекать страницы из PDF-файла. В этой статье мы рассмотрим, как извлекать страницы из PDF на Java.

В этой статье должны быть раскрыты следующие темы:

Java PDF Pages Extractor REST API и установка SDK

GroupDocs.Merger Cloud SDK для Java — это облачный API, который позволяет разработчикам объединять, извлекать, разделять, изменять порядок и удалять страницы из файлов и других типов документов, включая Word, Excel. , PowerPoint, HTML, PDF и многое другое. Этот мощный SDK прост в использовании и может быть интегрирован в приложение на основе Java для автоматизации задач по работе с файлами.

Вы можете либо скачать файл JAR API, либо установить его с помощью Maven, добавив следующий репозиторий и зависимость в файл pom.xml вашего проекта:

Репозиторий Мавена:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Зависимость Мейвена:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-merger-cloud</artifactId>
    <version>23.2</version>
    <scope>compile</scope>
</dependency>

Теперь вам нужно зарегистрироваться для получения бесплатной пробной учетной записи или приобрести план подписки на веб-сайте GroupDocs, чтобы получить ключ API. Получив идентификатор клиента и секрет клиента, добавьте приведенный ниже фрагмент кода в приложение на основе Java:

# Получите свой client_id и client_secret с https://dashboard.groupdocs.cloud после регистрации.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Как извлечь страницы PDF по точным номерам страниц в Java

Чтобы извлечь страницы из PDF-файла с помощью GroupDocs.Merger Cloud SDK для Java, вам необходимо выполнить следующие действия:

Загрузите файлы

Во-первых, загрузите файл PDF в облако, используя приведенный ниже пример кода:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Загрузить файл в облачное хранилище с помощью Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

В результате загруженный PDF-файл будет доступен в разделе файлов вашей панели управления в облаке.

Извлечение страниц из PDF-файлов в Java

Вот пошаговое руководство и пример фрагмента кода о том, как извлечь страницы из файла PDF с помощью GroupDocs.Merger Cloud SDK для Java:

  • Во-первых, импортируйте необходимые классы в ваш файл Java.
  • Во-вторых, создайте экземпляр класса PagesApi.
  • В-третьих, создайте экземпляр класса FileInfo.
  • После этого установите путь к исходному входному файлу.
  • Теперь создайте экземпляр класса ExtractOptions().
  • Затем определите параметры извлечения setFileInfo, setOutputPath и коллекции setPages в формате массива.
  • Теперь создайте экземпляр класса ExtractRequest() и передайте параметр ExtractOptions.
  • Наконец, извлеките страницы, вызвав метод extract() PagesApi и передав параметр ExtractRequest.

В следующем фрагменте кода показано, как разделить PDF-файлы на отдельные страницы в Java с помощью REST API:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Как извлечь страницы PDF по точным номерам страниц в Java.
public class App {

	public static void main(String[] args) {

		// Создайте экземпляр API страниц.			
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Подготовьте настройки
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setPages(Arrays.asList(3, 5, 7));

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Получить путь к выходному файлу
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Загрузите файл

Приведенный выше пример кода сохранит определенные страницы PDF в облаке. Вы можете загрузить его, используя следующий пример кода:

package com.groupdocsdev.classes;

import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Скачать файл из облачного хранилища с помощью Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {

			DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.out.println("Expected response type is downloadFile: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Как извлечь страницы из PDF по диапазонам страниц с помощью Java

В этом разделе мы рассмотрим пошаговое руководство и пример фрагмента кода для сохранения выбранных страниц из PDF с использованием Java путем применения диапазона страниц:

  • Во-первых, импортируйте необходимые классы в ваш файл Java.
  • Во-вторых, создайте экземпляр класса PagesApi.
  • В-третьих, создайте экземпляр класса FileInfo.
  • После этого установите путь к исходному входному файлу.
  • Теперь создайте экземпляр класса ExtractOptions().
  • Затем определите параметры извлечения setFileInfo, setOutputPath, setStartPageNumber и setEndPageNumber.
  • Затем установите для параметров страницы setRangeMode значение EVENPAGES.
  • Теперь создайте экземпляр класса ExtractRequest() и передайте параметр ExtractOptions.
  • Наконец, извлеките страницы, вызвав метод extract() PagesApi и передав параметр ExtractRequest.

В следующем фрагменте кода показано, как извлечь страницы PDF, применяя диапазон и режим страниц в Java:

package com.groupdocsdev.classes;

import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;

// Как извлечь страницы из PDF по диапазонам страниц с помощью Java.
public class App {

	public static void main(String[] args) {
		
		// Создайте экземпляр API страниц.		
		PagesApi apiInstance = new PagesApi(configuration);

		try {

			// Подготовьте настройки
			FileInfo fileInfo = new FileInfo();			
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ExtractOptions options = new ExtractOptions();
			options.setFileInfo(fileInfo);
			options.setOutputPath("java-testing/output-sample-file.pdf");
			options.setStartPageNumber(1);
			options.setEndPageNumber(10);
			options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);

			ExtractRequest request = new ExtractRequest(options);

			DocumentResult response = apiInstance.extract(request);
			
			// Получить путь к выходному файлу
			System.out.println("Output file path: " + response.getPath());
			
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Бесплатный онлайн-экстрактор PDF-страниц

Как извлечь страницы PDF бесплатно? Пожалуйста, попробуйте бесплатный экстрактор страниц PDF, чтобы бесплатно извлечь определенные страницы из PDF. Этот онлайн-экстрактор PDF-страниц разработан с использованием вышеупомянутых облачных API-интерфейсов Groupdocs.Merger.

Заключение

GroupDocs.Merger Cloud SDK для Java предоставляет простой способ извлечения страниц PDF в новый PDF на Java. Вот что вы узнали из этой статьи:

  • как разделить файлы PDF на несколько страниц по номерам с помощью Java;
  • программно загружать и скачивать файл PDF с помощью Java в облаке;
  • разделить PDF на отдельные страницы в Java, используя диапазоны страниц;
  • и извлекайте страницы из PDF онлайн бесплатно, используя бесплатный онлайн-экстрактор страниц PDF.

Кроме того, мы также предоставляем раздел справки по API, который позволяет вам визуализировать наши API и взаимодействовать с ними непосредственно через браузер. Полный исходный код Java SDK находится в свободном доступе на Github. Пожалуйста, проверьте GroupDocs.Merger Cloud SDK для Java Примеры здесь.

Кроме того, мы предлагаем вам следовать нашему Руководству по началу работы для получения подробных инструкций и использования API.

Наконец, мы продолжаем писать новые сообщения в блогах о различных операциях с документами с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.

Задайте вопрос

Если у вас есть какие-либо вопросы об API извлечения страниц PDF, задайте их нам на Форуме бесплатной поддержки.

Часто задаваемые вопросы

Как извлечь страницы из файла PDF в Java?

Вы можете извлечь страницы из PDF-файла с помощью GroupDocs.Merger Cloud SDK для Java.

Можно ли экспортировать одну страницу из PDF в Java?

Да, вы можете программно извлекать страницы PDF в отдельные файлы на Java с помощью GroupDocs.Merger Cloud SDK для Java.

Файлы каких форматов можно извлекать из файлов с помощью GroupDocs.Merger Cloud SDK для Java?

Помимо PDF-файлов, GroupDocs.Merger Cloud SDK для Java может извлекать страницы из Microsoft Word, Excel, PowerPoint, HTML и других форматов файлов.

Смотрите также

Вот несколько связанных статей, которые могут оказаться полезными: