Якщо ви працюєте з файлами PDF, ви можете опинитися в ситуації, коли вам потрібно витягти сторінки з файлу PDF. Видобування сторінок із PDF-файлу може зайняти багато часу, особливо якщо це потрібно робити вручну або працювати з великими документами. На щастя, за допомогою GroupDocs.Merger Cloud SDK для Java ви можете легко видобувати сторінки з PDF-файлу програмним шляхом. У цій статті ми розглянемо, як видобувати сторінки з PDF на Java.
У цій статті будуть розглянуті такі теми:
- Інсталяція REST API та SDK Java PDF Pages Extractor
- Як видобувати PDF-сторінки за точними номерами сторінок у Java
- Як видобувати сторінки з PDF за діапазонами сторінок за допомогою Java
Java PDF Pages Extractor REST API та встановлення SDK
GroupDocs.Merger Cloud SDK для Java – це хмарний API, який дозволяє розробникам об’єднувати, видобувати, розділяти, змінювати порядок і видаляти сторінки з файлів та інших типів документів, включаючи Word, Excel , PowerPoint, HTML, PDF та багато іншого. Цей потужний SDK простий у використанні та може бути інтегрований у програму на основі Java для автоматизації завдань обробки файлів.
Ви можете завантажити JAR-файл API або встановити його за допомогою Maven, додавши таке сховище та залежність у файл pom.xml вашого проекту:
Репозиторій Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Залежність Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger-cloud</artifactId>
<version>23.2</version>
<scope>compile</scope>
</dependency>
Тепер вам потрібно зареєструватися для безкоштовного пробного облікового запису або придбати план підписки на веб-сайті GroupDocs, щоб отримати ключ API. Отримавши ідентифікатор клієнта та секрет клієнта, додайте наведений нижче фрагмент коду до програми на основі Java:
# Отримайте свій client_id і client_secret на https://dashboard.groupdocs.cloud після реєстрації.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Як витягти сторінки PDF за точними номерами сторінок у Java
Щоб витягнути сторінки з PDF-файлу за допомогою GroupDocs.Merger Cloud SDK для Java, вам потрібно буде виконати такі дії:
- Завантажте файли PDF у хмару
- Видобуток сторінок PDF із використанням Java
- Завантажити PDF-документ
Завантажте файли
По-перше, завантажте PDF-файл у хмару, використовуючи наведений нижче приклад коду:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Завантажте файл у хмарне сховище за допомогою Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
У результаті завантажений PDF-файл буде доступний у розділі файлів вашої інформаційної панелі в хмарі.
Видобувати сторінки з PDF-файлів у Java
Ось покрокове керівництво та приклад фрагмента коду щодо того, як видобувати сторінки з PDF-файлу за допомогою GroupDocs.Merger Cloud SDK для Java:
- По-перше, імпортуйте необхідні класи у свій файл Java.
- По-друге, створіть екземпляр класу PagesApi.
- По-третє, створіть екземпляр класу FileInfo.
- Після цього встановіть вихідний шлях до вхідного файлу.
- Тепер створіть екземпляр класу ExtractOptions().
- Потім визначте параметри вилучення setFileInfo, setOutputPath і колекцію setPages у форматі масиву.
- Тепер створіть екземпляр класу ExtractRequest() і передайте параметр ExtractOptions.
- Нарешті, витягніть сторінки, викликавши метод extract() PagesApi і передавши параметр ExtractRequest.
У наступному фрагменті коду показано, як розділити PDF-файли на окремі сторінки в Java за допомогою REST API:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Як витягти сторінки PDF за точними номерами сторінок у Java.
public class App {
public static void main(String[] args) {
// Створіть екземпляр Pages API.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Підготуйте налаштування
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setPages(Arrays.asList(3, 5, 7));
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Отримати вихідний шлях до файлу
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Завантажте файл
Наведений вище приклад коду збереже певні сторінки PDF-файлу в хмарі. Ви можете завантажити його за допомогою наступного зразка коду:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Завантажте файл із хмарного сховища за допомогою Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.pdf", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.out.println("Expected response type is downloadFile: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Як видобувати сторінки з PDF за діапазонами сторінок за допомогою Java
У цьому розділі ми розглянемо покроковий посібник і приклад фрагмента коду для збереження вибраних сторінок із PDF за допомогою Java із застосуванням діапазону сторінок:
- По-перше, імпортуйте необхідні класи у свій файл Java.
- По-друге, створіть екземпляр класу PagesApi.
- По-третє, створіть екземпляр класу FileInfo.
- Після цього встановіть вихідний шлях до вхідного файлу.
- Тепер створіть екземпляр класу ExtractOptions().
- Потім визначте параметри вилучення setFileInfo, setOutputPath, setStartPageNumber і setEndPageNumber.
- Далі встановіть параметри сторінки setRangeMode на EVENPAGES.
- Тепер створіть екземпляр класу ExtractRequest() і передайте параметр ExtractOptions.
- Нарешті, витягніть сторінки, викликавши метод extract() PagesApi і передавши параметр ExtractRequest.
У наступному фрагменті коду показано, як видобувати сторінки PDF, застосовуючи діапазон сторінок і режим у Java:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Як видобувати сторінки з PDF за діапазонами сторінок за допомогою Java.
public class App {
public static void main(String[] args) {
// Створіть екземпляр Pages API.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Підготуйте налаштування
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.pdf");
options.setStartPageNumber(1);
options.setEndPageNumber(10);
options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Отримати вихідний шлях до файлу
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Безкоштовний онлайн-екстрактор PDF-сторінок
Як безкоштовно розпакувати PDF-сторінки? Спробуйте безкоштовний екстрактор сторінок PDF, щоб безкоштовно витягти певні сторінки з PDF. Цей онлайн-екстрактор PDF-сторінок розроблено з використанням вищезгаданих API Groupdocs.Merger Cloud.
Висновок
GroupDocs.Merger Cloud SDK для Java забезпечує простий спосіб видобування PDF-сторінок у новий PDF-файл на Java. Ось що ви дізналися з цієї статті:
- як розділити PDF-файли на кілька сторінок за номерами за допомогою Java;
- програмно завантажувати та завантажувати файл PDF за допомогою Java у хмарі;
- розділити PDF на окремі сторінки в Java за допомогою діапазонів сторінок;
- і безкоштовно витягуйте сторінки з PDF-файлів онлайн за допомогою безкоштовного засобу для вилучення сторінок PDF-файлів онлайн.
Крім того, ми також надаємо довідковий розділ API, який дозволяє візуалізувати наші API та спілкуватися з ними безпосередньо через браузер. Повний вихідний код Java SDK є у вільному доступі на Github. Будь ласка, перевірте GroupDocs.Merger Cloud SDK для Java Приклади тут.
Крім того, ми пропонуємо вам ознайомитися з нашим посібником із початку роботи, щоб отримати докладні кроки та використання API.
Нарешті, ми продовжуємо писати нові повідомлення в блозі про різні операції з документами за допомогою REST API. Тому зв’яжіться з нами, щоб отримувати регулярні оновлення.
Задайте питання
Якщо у вас виникли запитання щодо API екстрактора PDF-сторінок, задайте їх на безкоштовному форумі підтримки.
поширені запитання
Як витягти сторінки з PDF-файлу в Java?
Ви можете видобувати сторінки з файлу PDF за допомогою GroupDocs.Merger Cloud SDK для Java.
Чи можна експортувати одну сторінку з PDF у Java?
Так, ви можете програмно видобувати сторінки PDF в окремі файли в Java за допомогою GroupDocs.Merger Cloud SDK для Java.
З яких форматів файлів можна видобувати сторінки за допомогою GroupDocs.Merger Cloud SDK для Java?
Окрім PDF-файлів, GroupDocs.Merger Cloud SDK для Java може видобувати сторінки з Microsoft Word, Excel, PowerPoint, HTML та інших форматів файлів.
Дивись також
Ось деякі пов’язані статті, які можуть бути вам корисними:
- Розділіть документи Word на окремі файли в Java
- Як об’єднати документи Word (DOC, DOCX) у Java
- Як розділити слайди PowerPoint PPT або PPTX на Python
- Витягніть певні сторінки з PDF за допомогою Python
- Витягуйте сторінки з документів Word за допомогою Rest API
- Об’єднайте файли PowerPoint PPT/PPTX онлайн за допомогою REST API
- Як змінити орієнтацію сторінки в документі Word за допомогою Ruby
- Як розділити документ Word на окремі файли за допомогою Node.js