Если вы работаете с файлами PDF, вы можете столкнуться с ситуацией, когда вам нужно извлечь страницы из файла PDF. Извлечение страниц из PDF-файла может занять много времени, особенно если вам приходится делать это вручную или работать с большими документами. К счастью, с помощью GroupDocs.Merger Cloud SDK для Java вы можете легко программно извлекать страницы из PDF-файла. В этой статье мы рассмотрим, как извлекать страницы из PDF на Java.
В этой статье должны быть раскрыты следующие темы:
- Java PDF Pages Extractor REST API и установка SDK
- Как извлечь страницы PDF по точным номерам страниц в Java
- Как извлечь страницы из PDF по диапазонам страниц с помощью Java
Java PDF Pages Extractor REST API и установка SDK
GroupDocs.Merger Cloud SDK для Java — это облачный API, который позволяет разработчикам объединять, извлекать, разделять, изменять порядок и удалять страницы из файлов и других типов документов, включая Word, Excel. , PowerPoint, HTML, PDF и многое другое. Этот мощный SDK прост в использовании и может быть интегрирован в приложение на основе Java для автоматизации задач по работе с файлами.
Вы можете либо скачать файл JAR API, либо установить его с помощью Maven, добавив следующий репозиторий и зависимость в файл pom.xml вашего проекта:
Репозиторий Мавена:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Зависимость Мейвена:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger-cloud</artifactId>
<version>23.2</version>
<scope>compile</scope>
</dependency>
Теперь вам нужно зарегистрироваться для получения бесплатной пробной учетной записи или приобрести план подписки на веб-сайте GroupDocs, чтобы получить ключ API. Получив идентификатор клиента и секрет клиента, добавьте приведенный ниже фрагмент кода в приложение на основе Java:
# Получите свой client_id и client_secret с https://dashboard.groupdocs.cloud после регистрации.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Как извлечь страницы PDF по точным номерам страниц в Java
Чтобы извлечь страницы из PDF-файла с помощью GroupDocs.Merger Cloud SDK для Java, вам необходимо выполнить следующие действия:
- Загрузить PDF-файлы в облако
- Извлечение PDF-страницы с использованием Java
- Скачать PDF-документ
Загрузите файлы
Во-первых, загрузите файл PDF в облако, используя приведенный ниже пример кода:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Загрузить файл в облачное хранилище с помощью Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
В результате загруженный PDF-файл будет доступен в разделе файлов вашей панели управления в облаке.
Извлечение страниц из PDF-файлов в Java
Вот пошаговое руководство и пример фрагмента кода о том, как извлечь страницы из файла PDF с помощью GroupDocs.Merger Cloud SDK для Java:
- Во-первых, импортируйте необходимые классы в ваш файл Java.
- Во-вторых, создайте экземпляр класса PagesApi.
- В-третьих, создайте экземпляр класса FileInfo.
- После этого установите путь к исходному входному файлу.
- Теперь создайте экземпляр класса ExtractOptions().
- Затем определите параметры извлечения setFileInfo, setOutputPath и коллекции setPages в формате массива.
- Теперь создайте экземпляр класса ExtractRequest() и передайте параметр ExtractOptions.
- Наконец, извлеките страницы, вызвав метод extract() PagesApi и передав параметр ExtractRequest.
В следующем фрагменте кода показано, как разделить PDF-файлы на отдельные страницы в Java с помощью REST API:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Как извлечь страницы PDF по точным номерам страниц в Java.
public class App {
public static void main(String[] args) {
// Создайте экземпляр API страниц.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Подготовьте настройки
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setPages(Arrays.asList(3, 5, 7));
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Получить путь к выходному файлу
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Загрузите файл
Приведенный выше пример кода сохранит определенные страницы PDF в облаке. Вы можете загрузить его, используя следующий пример кода:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Скачать файл из облачного хранилища с помощью Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.out.println("Expected response type is downloadFile: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Как извлечь страницы из PDF по диапазонам страниц с помощью Java
В этом разделе мы рассмотрим пошаговое руководство и пример фрагмента кода для сохранения выбранных страниц из PDF с использованием Java путем применения диапазона страниц:
- Во-первых, импортируйте необходимые классы в ваш файл Java.
- Во-вторых, создайте экземпляр класса PagesApi.
- В-третьих, создайте экземпляр класса FileInfo.
- После этого установите путь к исходному входному файлу.
- Теперь создайте экземпляр класса ExtractOptions().
- Затем определите параметры извлечения setFileInfo, setOutputPath, setStartPageNumber и setEndPageNumber.
- Затем установите для параметров страницы setRangeMode значение EVENPAGES.
- Теперь создайте экземпляр класса ExtractRequest() и передайте параметр ExtractOptions.
- Наконец, извлеките страницы, вызвав метод extract() PagesApi и передав параметр ExtractRequest.
В следующем фрагменте кода показано, как извлечь страницы PDF, применяя диапазон и режим страниц в Java:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Как извлечь страницы из PDF по диапазонам страниц с помощью Java.
public class App {
public static void main(String[] args) {
// Создайте экземпляр API страниц.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Подготовьте настройки
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setStartPageNumber(1);
options.setEndPageNumber(10);
options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Получить путь к выходному файлу
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Бесплатный онлайн-экстрактор PDF-страниц
Как извлечь страницы PDF бесплатно? Пожалуйста, попробуйте бесплатный экстрактор страниц PDF, чтобы бесплатно извлечь определенные страницы из PDF. Этот онлайн-экстрактор PDF-страниц разработан с использованием вышеупомянутых облачных API-интерфейсов Groupdocs.Merger.
Заключение
GroupDocs.Merger Cloud SDK для Java предоставляет простой способ извлечения страниц PDF в новый PDF на Java. Вот что вы узнали из этой статьи:
- как разделить файлы PDF на несколько страниц по номерам с помощью Java;
- программно загружать и скачивать файл PDF с помощью Java в облаке;
- разделить PDF на отдельные страницы в Java, используя диапазоны страниц;
- и извлекайте страницы из PDF онлайн бесплатно, используя бесплатный онлайн-экстрактор страниц PDF.
Кроме того, мы также предоставляем раздел справки по API, который позволяет вам визуализировать наши API и взаимодействовать с ними непосредственно через браузер. Полный исходный код Java SDK находится в свободном доступе на Github. Пожалуйста, проверьте GroupDocs.Merger Cloud SDK для Java Примеры здесь.
Кроме того, мы предлагаем вам следовать нашему Руководству по началу работы для получения подробных инструкций и использования API.
Наконец, мы продолжаем писать новые сообщения в блогах о различных операциях с документами с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.
Задайте вопрос
Если у вас есть какие-либо вопросы об API извлечения страниц PDF, задайте их нам на Форуме бесплатной поддержки.
Часто задаваемые вопросы
Как извлечь страницы из файла PDF в Java?
Вы можете извлечь страницы из PDF-файла с помощью GroupDocs.Merger Cloud SDK для Java.
Можно ли экспортировать одну страницу из PDF в Java?
Да, вы можете программно извлекать страницы PDF в отдельные файлы на Java с помощью GroupDocs.Merger Cloud SDK для Java.
Файлы каких форматов можно извлекать из файлов с помощью GroupDocs.Merger Cloud SDK для Java?
Помимо PDF-файлов, GroupDocs.Merger Cloud SDK для Java может извлекать страницы из Microsoft Word, Excel, PowerPoint, HTML и других форматов файлов.
Смотрите также
Вот несколько связанных статей, которые могут оказаться полезными:
- Разделить документы Word на отдельные файлы в Java
- Как объединить документы Word (DOC, DOCX) в Java
- Как разделить слайды PowerPoint PPT или PPTX в Python
- Извлечение определенных страниц из PDF с помощью Python
- Извлечение страниц из документов Word с помощью Rest API
- Объединяйте файлы PowerPoint PPT/PPTX онлайн с помощью REST API
- Как изменить ориентацию страницы в документе Word с помощью Ruby
- Как разделить документ Word на отдельные файлы с помощью Node.js